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A. PRESENTATION DE LA RECHERCHE 


Al Généralités 


Interprétant l'expérience accumulée depuis 20 ans en robotique, on peut admettre que. la 
perception des machines autonomes est un problème majeur de leur conception, dont la 
résolution influe par exemple sur leur dynamique aussi sûrement que leurs 
aptitudes mécaniques. Il suffit pour s'en donner l'intuition d'imaginer les performances 
d'un mobile qui "voit" à quelques décimètres devant lui et de les comparer à celles d'un 
véhicule qui verrait à quelques dizaines de mètres. Encore faut-il que le système puisse tirer 
parti de ce surcroît de données, de ces délais supplémentaires qui lui sont fournis. En d'autres 
termes, l'information plus riche rend l'anticipation possible, et donc une meilleure adaptation 
voire une certaine intelligence du (contrôle de) comportement pour peu que l'on sache l'extraire. 
Or, il semble que l'état de l'art en matière de traitement de signal ou d'image ne permet pas de 
surmonter , et encore moins en temps réel, la complexification scénique résultant par exemple 
du simple accroissement de champ évoqué précédemment: à quelques décimètres, le robot 
pourra au mieux essayer de se caler par rapport aux bords d'une route pour traquer la ligne 
centrale à l'aide d'un traitement assez élémentaire, à quelques dizaines de mètres toutes les 
Stratégies de contrôle lui sont ouvertes mais au prix d'une analyse de scène non structurée qui 
ressortit à la recherche actuelle en vision jusques en ses facettes les plus technologiques. 


Sans multiplier les exemples, on peut affirmer que ce mécanisme d'émergence du contrôle, 
lié à la sophistication nécessaire des moyens sensoriels, se généralise d'abord à d'autres 
capteurs (capteurs séismiques, télémétrique, radar,) dès lors qu'on étend leurs capacités 
individuelles quel que soit le(s) paramètre(s) considéré(s) pour ce faire. Ensuite, il apparaît 
également valide lorsque l'on considère un ensemble de capteurs puisqu'à l'évidence, une 
solution élégante pour ce qui est de l'acquisition plus complète de paramètres sur 
l'environnement et le système lui-même, est la multiplication des capteurs, dont les 
complémentarités physiques permettent éventuellement de moindres performances individuelles 
et des traitements plus simples pour peu qu'ils sachent travailler en équipe. Enfin, ce mécanisme 
resurgit à nouveau, lorsque cherchant à simplifier le traitement et l'analyse non plus par 
association de capteurs, mais par leur emploi plus spécifique, on exploite les aptitudes du 
système, devenu actif, à diriger ses moyens sensoriels, capteurs puis traitements. 


Des trois schémas progressivement plus complexes proposés comme palliant les insuffisances, 
probablement intrinsèques , du traitement de données dans les robots autonomes, on retiendra la 
désormais nécessaire explicitation du contrôle à la fois des capteurs et des traitements dans les 
algorithmes de perception. Mais il est encore plus important de remarquer qu'un tel processus 
supposé produire un comportement progressivement plus intelligent du système obéit à la 
règle de programmation moderne (intelligence artificielle), popularisée notamment à travers les 
systèmes experts, qui préconise la séparation entre les connaissances et la manière de les 
utiliser. Les capteurs sont la matérialisation d'autant de connaissances sur leur validité 
d'emploi, leurs limites défauts et qualités, les traitements qu'ils requièrent...; ce sont 
également des vecteurs d'une certaine connaissance et de faits concernant le système et 
l'univers où il évolue. | 


Ces quelques considérations expliquent à la fois la structure et l'évolution du laboratoire 
"Système de Perception. j 


Il est en effet le laboratoire de recherche propre de la DRET qui poursuit des activités en 
électronique, informatique (dont traitement d'image et intelligence artificielle) et technologie, 
aussi bien qu'en physique de l'environnement, des capteurs et de leur utilisation. L'importance 


du domaine de recherche, indépendamment de l'étendue des techniques nécessaires et de leurs 


progrès récents, vient de l'essor rapide du secteur “robotique militaire", vital pour la défense. 


1 


Cette importance, dont il a été pris conscience quelques sept ans plus tôt, a motivé au sein de 
l'ETCA un regroupement d'activités allant du traitement numérique des images à la détectabilité 
et au camouflage en passant par les architectures d'exécution de traitement de données; ce 
regroupement a débuté avec l'aboutissement et le transfert de recherches en traitement d'image 
sous forme de la création d'un centre expérimental de photointerprétation mis à la disposition 
des armées, création qui a favorisé une ré-orientation vers des activités plus amont, elle-même 
achevée fin 1986 avec pour résultat le laboratoire sous sa forme actuelle, c'est-à-dire: 


un thème de recherche: _ l'étude des moyens d'acquérir, traiter et interpréter des 
données relatives à une scène dans le but de l'action . 
éclaté en trois axes théoriques: modélisation du réel et étude de performances (capteurs, 


scènes, simulation) 
définition et spécification des fonctions (traitement, 
décision, contrôle) | 
réalisation effective et technologie (architecture, 
intégration, (auto)-programmation) 

eux-mêmes supportés par 4 ateliers: électronique 

| informatique 

algorithmique 
capteurs 

où sont développés les dispositifs expérimentaux probatoires (3 à ce jour): 
HECATE: émulateur d'automates de vision 
Robotisation du laser d'usinage 5KW 
Plateforme multicapteur 


Par ailleurs avec l'arrivée des résultats de l'effort recherche, on note depuis deux ans 
l'augmentation du niveau de transfert : à la diffusion permanente de personnels formés quittant 
le laboratoire s'ajoutent la formation de personnels détachés de grandes sociétés travaillant pour 
la défense, et des produits performants en filiation directe de la recherche mis sur le marché 
européen par des PMI dont les cadres sont majoritairement issus du laboratoire. 


Quant à l'évolution, elle devrait naturellement calquer les problèmes que l'on sait traiter. 
Pour une meilleure efficacité architecturale, il serait bon qu'à un terme proche, les ateliers 
électronique et informatique se regroupent pour la recherche plus technologique sur les moyens 
de perception; de même, les ateliers algorithmique et capteurs pourraient joindre leurs efforts 
pour des études plus globales sur le contrôle de ces moyens et leur application. Les deux entités 
ainsi créées verraient leur complémentarité exploitée par le souci renforcé de miniaturisation, 
fiabilisation et dynamisme des systèmes: 


- Circuits intégrés prenant le pas sur l'électronique plus classique, parallélisme de plus 


en plus massif et logiciel dépouillé.... du côté "technologique" 


- algorithmie de traitement de plus en plus coopérative, exploitant le parallélisme, tenant 
compte des capteurs éventuellement "intelligents" ou très adaptés à une tâche, simplification de 
la programmation via le contrôle et tentatives d'auto-programmation... du côté ‘contrôle et 
application", 


en vue de l'implantation réaliste de systèmes expérimentaux complets; une telle démarche 


permet que certaines parties prouvées soient incorporées progressivement à des dispositifs 
réels. 


Le thème de recherche défini en 82 et exposé dans les rapports précédents varie donc peu. Nous 
ne le rappellerons pas plus en détail, si bien que ce chapitre se termine par l'exposé des faits 
marquants 87/88 et l'analyse de certains facteurs d'évolution. | 


. Le deuxième chapitre regroupe les activités de recherche et développement 87/88 
structurées par “ateliers” permettant ainsi de faire le point sur les moyens sans perturber 
l'exposé. | | | 





. Le troisième chapitre est constitué de courts rapports individuels définissant un 


problème précis, les solutions proposées et d'éventuels résultats. 


. La conclusion est consacrée aux relations du laboratoire avec l'extérieur: coopérations, 
interventions à caractère pédagogique, publications, rapports internes. 


A2 Faits marquants 87/88 et tendances d'évolution 


Cette présentation ne peut que s'inscrire dans la stricte continuité du chapitre A (p 1 à 8) du 
rapport 85-86 dont les termes ne seront donc pas repris à l'exception du $ précédent. Par 
rapport à ce récent passé, on peut souligner d'emblée la stabilité des activités. Le laboratoire 
semble avoir véritablement atteint un régime dynamique acceptable qu'il exploite au mieux. Cet 
état est d'autant plus perceptible que la période écoulée a recouvert une phase de réalisation 
assez intense, c'est-à-dire de consolidation des projets à la quasi exclusion de toute mise en 
chantier d'activité nouvelle. La seule exception apparaît être un essai de conception de rétine 
sous forme d'un réseau de neurones qui binarise l'image, et pourra la traiter dans des conditions 
raisonnables au prix d'une éventuelle poussée analogique! 


Pour le reste, 1l est commode de séparer les résultats d'évolution du laboratoire en faits 
nouveaux significatifs et en renforcement des "manips", qu'il s'agisse de dispositifs 
expérimentaux proprement dits, ou de vérifications expérimentales. 


A2.1 Faits significatifs 


a) La rétine neuronale: les procédés de B-codage, destinés au processeur rétinien, qui ne 
traite que des images binaires par définition, sont l'objet d'un compromis fortement contraint 
entre la fidélité du procédé (conservation de l'information" présente sur l'image analogique 
originelle) et son intégrabilité (minimisation de la surface en silicium nécessaire). Par 
comparaison avec les recherches antérieures (B-codage à matrices de seuils, puis B-codage à 
inhibition latérale) l'étude d'un procédé de B-codage neuronal déplace le compromis vers une 
meilleure fidélité au détriment d'une complexité accrue mais encore acceptable. On implante la 
minimisation d'une distance de type quadratique entre l'image analogique originelle et la 
convoluée de l'image binarisée par un certain type de noyau. Une‘minimisation "locale" est 
obtenue par l'évolution d'un automate à seuils, dont l'implantation analogique se limite à une 
dizaine de transistors par pixels /T. BERNARD]. Parallèlement, une étude plus théorique du 
problème de minimisation énoncé ci-dessus permet une évaluation plus quantitative de la fidélité 
de procédés itératifs analogues /8. DUGAS]. Elle a permis notamment de mieux comprendre le 
compromis “itération dans le processus parallèle "vs" maîtrise de la binarisation". 


b) En contrôle évolué et coopération multicapteurs, on relève trois résultats importants, 
ce qui correspond bien à l'accent mis sur ce secteur. Tout d'abord CANDIDE, le programme 
apprenti, a engendré son premier jeu de règles de comportement écrivant ainsi sans intervention 
humaine directe, le premier contrôleur à base de connaissances [B. BURG]. CANDIDE scrute 
une base de données expérimentales issues de campagnes de mesures qu'il traite 
successivement par des techniques statistiques pour l'extraction de grandeurs signifiantes, puis 
structurelles (relations entre ces grandeurs), et enfin symboliques pour synthétiser des règles à 
partir de connaissances très frustes d'automatique (notion de dérivée et de points limites). A 
partir du niveau structurel, la méthode est du type induction suivant un schéma de "classification 
conceptuelle “inspiré de Diday et Michalsky (généralisation la plus spécifique, compte tenu de 
descripteurs de données), elle a suggéré un procédé de synthèse de grammaire en univers 
bruité pour lequel certaines preuves de robustesse sont apportées /D. LUZEAUXI. L'application 
est pour le moment une simulation de conduite de voiture sur circuit, le contrôleur réussissant à 
la maintenir sur la chaussée et s'améliorant (au vu de ses résultats) au gré des itérations de 
CANDIDE sur ses propres productions. Mais le retour vers le laser est imminent et une 
application à l'analyse d'évolution d'une population d'automates en cours [V. ELZIERE] 


} 











Résultat plus pratique, mais également important, un contrôleur stochastique a été effectivement 
implanté sur le calculateur SUN qui gère la fusion multicapteur. Rappelons que nous 
distinguons deux niveaux dans le système d'intégration et de contrôle de la plateforme 
multicapteur: le symbolique, et le présymbolique qui nous intéresse ici, et qui utilise en fait des 
techniques probabilistes classiques. Nous avons tout d'abord appliqué une estimation récursive 
à un modèle de contrôle d'une fenêtre d'observation en vue d'une optimisation de la 
surveillance opérationnelle d'un horizon /x. MERLO] Puis, nôus avons utilisé ces techniques 
dans le cadre plus complexe d'une simulation d'un système de défense anti-missile incluant 
deux capteurs, un radar et une caméra, des objets de divers types, et des critères de performance 
basés sur un bouclage direct avec l'univers (taux de destruction des missiles, quantité de 
munitions consommées) et non plus sur une simple surveillance /X. MERLO, J. de DINECHINI. 
On observe au fur et à mesure de la complexification de ces modèles une tendance à l'utilisation 
de techniques symboliques à l'intérieur même de ces estimations récursives, autant que dans 
l'interfaçage avec le niveau symbolique. C'est après ces simulations que nous avons transposé 
le contrôleur au cadre réel de la plateforme multicapteur, pour l'instant dans un modèle simple 
de coordination acoustique vision: en fonction de résultats sur les sources sonores, le contrôleur 
choisit la meilleure orientation de la caméra. A cette occasion, le modèle théorique a été amélioré 
puisque l'estimation récursive en temps discrétisé est étendue à l'utilisation d'un modèle 
poissonnien de la réalité, donc asynchrone et déclenchable par les événements /0. DESSOUDE, 
Y.VIMONT]. Cet essai réel suppose bien sûr que l'analyse acoustique donne des résultats 
satisfaisants, d'où le troisième résultat. | 


Les études récentes menées en traitement spatial d'antennes ont mis en évidence les 
performances des méthodes haute-résolution (HR) fondées sur la décomposition des signaux 
observés en deux espaces vectoriels complémentaires, signal et bruit (Tufts-Kumaresan, 
MUSIC) dès lors que les sources à identifier sont fortement corrélées ou spatialement proches. 


L'acoustique, dans le contexte de la perception des robots pose justement ces problèmes, liés à 
la multiplicité des sources éventuelles à localiser ainsi qu'aux fortes corrélations temporelles 
entre celles-ci (phénomènes d'échos multiples) auxquels, par l'utilisation d'algorithmes inspirés 
des méthodes HR, nous avons tenté d'apporter une réponse. 


Une méthode originale issue de ces algorithmes HR et intéressant des signaux à large bande 
spectrale est actuellement étudiée, qui donne tant en simulation que sur la base de données 
réelles, des résultats préliminaires encourageants pour la localisation de sources sonores mais 
encore pour l'estimation au niveau de l'antenne de la puissance associée à chaque source 0. 
MICHEL]. Une analyse systématique des termes d'erreurs est en cours, exploitant le système de 
calcul formel MACSYMA /F. MARTINERIE, A. LANUSSE] 


c) en algorithmie de traitement d'image, deux faits apparaissent essentiels, qui participent 
du recentrage de l'activité autour du concept de segmentation multicritères/multimodèles. On a 
assisté au début de l'utilisation réelle de LAMPION. Il a fallu d'abord réécrire les modules 
d'assistance structurée à la programmation et de support d'exécution (génie logiciel) pour les 
transférer du SEL 32 vers le réseau VINIX/SUN. A cette occasion, on a pu préciser la 
spécification des types et des utilitaires correspondants /V. SERFATY, E. DEVYS]. Dans le 
même temps, deux algorithmes complets développés au laboratoire pour des applications 
spécifiques étaient ré-analysés de manière exhaustive pour en dégager les "mécanismes". Ceci a 
* donné lieu à des extensions immédiates de bon augure pour la validité de la méthode: une 
détection de points d'intérêt engendre un algorithme d'extraction de contour intéressant, le 
procédé de poursuite dont il était une composante est, quant à lui, appliqué après 
aménagements, en vue de l'analyse de la déformation de taches solaires. Une “reconnaissance- 
suivi” de véhicules en formation suggère une définition du rôle des informations contextuelles. 
Ces exemples détaillés, associés au fond d'opérateurs que l'équipe recommence à constituer de | 
manière systématique, permettent surtout de réactiver le codage des bases de données et de 

l'environnement de création d'algorithmes /V. SERFATY, B. CARRE]. La connaissance en 
traitement d'images est représentée sous forme de graphes d'opérateurs traduisant des aspects 
tant cognitifs (propriétés des opérateurs, analogie...) qu'opérationnels (types d'objets traités, 
décomposition fonctionnelle, contrôle de flots de données...). Un graphe est vu comme un 








(a) (b) 





(c) (d) 


Algorithme de poursuite compact et robuste sur imagerie infra-rouge 


Résultats sur deux séquences synthétiques: 
occultation des cibles par des éléments du paysage 
(a )et (b ) plus froids 
(cc )et ( d ) de température voisine 


L'extraction conjointe de points caractéristiques et de régions alliée à l'exploitation de deux niveaux de modèles 
font que la poursuite n'est pas perturbée. | 


modèle général et hiérarchique d'al gorithme relativement aux différents points de vue précédents. 
Le système apparaît alors comme un outil graphique: 
- d'aide à la spécification puis à la génération d'algorithme, 


- d'essai de nouveaux algorithmes par des techniques de substitution des éléments du 
graphe après filtrage sur les propriétés et par analogie, 


- d'inférence de propriétés des algorithmes ainsi générés, de leur validation et, partant, 
de généralisation d'algorithmes. | À 


L'implantation de la base de connaissances et du système s'inscrit totalement dans une approche 
orientée objet. 


Le deuxième fait marquant est la conception du procédé de poursuite déjà mentionné fr. 
BONNIN]. Au plan algorithmique il est fondé sur la coopération entre caractéristiques, prônée par 
le laboratoire comme augmentant la robustesse des algorithmes lorsqu'elle est associée à 
l'exploitation d'un modèle de scènes, et ce sans véritable inflation de moyen. D'où un intérêt 
majeur pour les implantations éventuelles. Dans ce cas, le modèle est d'abord physique, issu de 
la propagation de la chaleur puisqu'il s'agit d'images infra-rouge. Il incite à une segmentation 
en régions, mais qui est elle-même corollaire d'une détection préalable de points d'intérêt. 
Réciproquement, les régions extraites valident les points d'intérêts dont elles élaguent 
l'ensemble, et ce sont ces points qui fondent la poursuite selon un deuxième modèle plus 
conceptuel de naissance et mort de points caractéristiques des cibles au cours du temps. Le 
résultat est extraordinairement robuste face, notamment, aux masquages. 


Soulignons que, LAMPION et la méthode de programmation en traitement d'image qu'il sous- 
tend a fortement intéressé un groupe OTAN au point qu'il pourrait être adopté comme vecteur 
de comparaison entre résultats des différents pays. 


d) En Architecture, les résultats importants sont autant du matériel que du logiciel, ce qui 
correspond logiquement à l'état de Hécate où les problèmes théoriques sont désormais plus en 
relation avec les logiciels résidents de diagnostic et d'aide à l'utilisateur, eux-mêmes 
indissociables de l'exploitation fine de la machine. 


Les concepts de base du Générateur d'Applications de Traitements Temps Réel d'Images 
(G.A.T.T.R.I.), destiné à la commande-test du module COLISE puis de HECATE reposent 
maintenant sur des principes d'homogénéité dans la manipulation des divers opérateurs d'une 
machine hétérogène, et d'utilisation optimale de celle-ci {S. DACIC, T. BOMMARTI. Le premier 
impératif d'homogénéité abordé d'abord à travers la notion de Frame a dérivé vers une 
méthodologie résolument objet où l'on a défini: 


- une hiérarchie "Naturelle" de décomposition de "macro" de traitements (clauses 
compilées) et de traitements (objets composites interprétés), que verra le "programmeur" sous 
forme graphique 


- les premières notions de dissémination du contrôle du parcours d'un graphe d'objets, 
dans ces objets (méthodes locales associées). 


Le deuxième principe d'optimalité de la commande, symbolisé dans GATTRI par un 
gestionnaire de ressources "intelligent" a nécessité un pré-découpage des opérateurs de COLISE 
en ‘micro-ressources" indépendantes dont la tabulation, associée à un parcours paramétré du 
graphe du traitement désiré par l'utilisateur, autorise le prototypage des futures règles 
d'allocation des ressources. | | - | 
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Les opérateurs des modules intervenant lors de l'exécution d'un algorithme sont ainsi, en fin de 
processus, des “objets informatiques" mis à plat sur un graphe; des champs concernant le 
diagnostic d'optimisation sont présents dans les frames permettant de modifier le parcours, 
voire même la forme définitive du graphe. 


Enfin, résultat non moins important et à plus d'un titre, de la recherche en architecture, l'année 
écoulée a vu le retour d'un transfert industriel qu'avaient motivé les résultats antérieurs d'études 
en système d'exploitation parallèle, puis à base de connaissances. Pour résoudre les problèmes 
décisionnels globaux au sein du logiciel de contrôle de la machine HECATE, un système à base 
de règles, copie conforme de la micro-machine du processeur d'exécution symbolique KIM 
réalisé par la PME SODIMA, est présent sur HECATE VO 1J.C. HEUDIN]. Dans un premier 
temps, en vue de prototypages, une version de communication à travers le système de mémoire 
partagée d'Unix system V est opérationnelle; ceci a permis de valider les concepts qui 
conduiront à l'écriture d'un acteur CHORUS gérant et contrôlant les communications de la 
machine (inter modules, SAU<---> SD, base de données <--->modules etc...) ainsi que les 
reconfigurations dynamiques automatiques. | 


Outre des jauges précises sur la charge globale de la machine favorisant le contrôle d'exécution, 
ces logiciels produisent une description du matériel activé pendant une session, directement 
exploitable par les programmes experts de parallélisation /A. SAFIR]. Ces programmes en cours 
d'écriture auront pour but de suggérer les conditions optimales d'intégration à large échelle 
(VLSI) de l'automate de traitement d'image correspondant. 


A2.2 Evolution des moyens expérimentaux et applications 


Le robot laser, dont l'avatar actif était l'apprentissage, a été relancé en tant que dispositif 
expérimental par le biais d'un autre retour de transfert. En effet, sa refonte a été confiée courant 
1987 à la PME ELA. qui en a reconstruit une version industrielle autour de la machine de 
vision GIP dérivée du savoir-faire acquis sur DICREM /P. MISSAkIAN]. Le calculateur de type 
PC qui gère les cartes TMS 320 de traitement d'image supporte pour l'occasion le contrôleur à 
règles et l'espion. Ce système mieux fini, donc plus attrayant pour les physiciens du laser a 
favorisé un regain d'expériences de découpe sur le site, si bien que le laboratoire reprend 
l'écriture systématique de contrôleurs pour l'analyse de leurs performances dans une 
perspective d'automatique plus classique [v. GOURET]. Dans le même temps, l'extension des 
moyens informatiques est aménagée avec l'implantation puis le couplage de machines SUN, 
supportant notamment le langage d'écriture de règles développé à l'université de Haute-Savoie 
[L. FOULLOY]. Parallèlement, des études d'automatisation plus conventionnelle du laser en 
traitement de surface sont entreprises par l'équipe “interaction laser-matière" avec l'adjonction 
d'autres capteurs qui bénéficient de ces moyens informatiques. 


Le succès de cette démarche, intervenant dans une période de décroissance d'effectifs, nous a 
incité à adopter une attitude semblable pour ce qui est de l'électromécanique de la plateforme 
multicapteurs. Nous avons donc défini, en commun avec E.LA., un ensemble organisé de 
capteurs (caméras, antenne acoustique, télémètre, sonar...) ainsi qu'un mécano original de 
supports orientables doté de logiciels de contrôle local. Ce robot PERCEPT, est en cours de 
réalisation chez notre partenaire industriel. A cette occasion, se renforce la collusion entre 
l'atelier capteur et l'atelier architectures matérielles. Celui-ci va désormais assister l'autre 
groupe pour tout ce qui concerne les réalisations matérielles de traitement câblé notamment, et le 
contrôle local de la plateforme par des calculateurs SUN dans lequel sont injectés des logiciels et 
du savoir-faire acquis sur HECATE /J.L. DESNOYER]. Nous finissons également de préparer 
l'arrivée sur ce site du télémètre développé à l'ENS de Cachan, donc accessible jusque dans ses 
moindres composantes, par la simulation réaliste de scènes représentées sous forme 
volumétrique, et l'association virtuelle à des images plus classiques des. données 
correspondantes. En particulier, l'atelier d'algorithmie étudie en coopération avec l'INRIA, 
l'exploitation du flou pour l'appréciation grossière de distance [{H. TONCHIA et A. LANUSSE] , 
et le placage de textures sur des images de profondeur. 








L' activité autour de HECATE est essentiellement de réalisation. Depuis début 1987, le 
noyau de la machine dit "version 0" est opérationnel constitué de CAPTIO, un module de mise 
en forme de contours et de DICREM, contrôlés par une SIM 90 quadfri-processeur sous UNIX 
et CHORUS et dotés d'un interface utilisateur déjà très évolué. Bien que son exploitation soit 
limitée, faute de personnel, aux concepteurs et autres utilisateurs privilégiés, le dispositif est 
augmenté à la fois dans ses aspects logiciels déjà évoqués et matériels, en vue d'un achèvement 
du projet, sous sa forme actuelle en 1990. Le module mémoire MORPHEE qui assure les 
séquencements multiples a été simplifié pour une réalisation plus rapide à fonctionnalités 
maintenues /P. KAJFASZ, J. BISSAY ] . Le module COLISE d'extraction de régions [M. ECCHER] 
supporte dans la version actuelle des enchaînements simples d'opérateurs élémentaires. Avec 
l'adjonction en cours des fonctions manquantes on étudie, d'une manière plus systématique, 
les possibilités de cet assembleur câblé en matière de détection de contour /M.P. GAYRARD]. L' 
architecture de DICREM a été prise pour base et repensée pour supporter efficacement des 
algorithmes de décision grammaticale plus généraux que la seule programmation dynamique. Le 
module résultant MEDCIN [J. BLANC-TALON] de type multiprocesseurs distribué comme 
DICREM mais doté d'un contrôleur général et plutôt MIMD, est en cours de simulation pour 
mieux spécifier les classes de communications sur des algorithmes jugés exemplaires. A cette 
occasion, est notamment testé un algorithme structurel particulier exploitant des formes fortes. 
Pourvu d'un réseau de communication universel, MEDCIN peut être envisagé comme 
calculateur d'usage général de performances très intéressantes au prix d'un effort logiciel 
conséquent /P. CLERMONT, E. CHARPENTIER]. Cette adaptation est prévue pour des modes de 
synchronisation particuliers du type SPMD (cf. machine OPSILA du LASSY) et l'étude en a 
d'ores et déjà commencé /P. MISSAKIAN, C. LEGRANDJ. Tous ces modules sont d'emblée 
pensés dans le cadre de communication par fibre optique via MORPHEE et sous contrôle de 
CHORUS et de la base de règles /P. HOFFMANNI. 


Pour ce qui est des architectures à échelle plus réduite, la période écoulée a été marquée 
par une phase de consolidation théorique ou de formalisation. Nous n'avons donc pas réalisé 
de circuit intégré à application spécifique (ASIC), si ce n'est le processeur élémentaire de la 
pyramide SPHINX conçu par le GME à l'LE.F. {F. DEVOS, A. MERIGOT], en étroite 
collaboration avec le laboratoire SP. Plus précisément, le circuit "courbes" retardé du fait du 
fondeur et le "cross-bar associatif" devaient être mis en maquette. Or, le premier est déjà d'une 
complexité qui nécessite le développement d'un véritable assembleur en plus de son contrôleur 
câblé. Le processeur élémentaire du circuit de calcul fonctionnel demandait une analyse plus 
détaillée à cause de l'approche adoptée qui lie intimement expression algorithmique et 
architecture {E. ALLART]. Cette analyse permet de ne pas déplacer, sans y prendre garde, tout le 
problème vers le contrôle des communications entre PE hypothéquant ainsi des solutions à 
évaluer... Les résultats nouveaux dans ce secteur s'établissent donc ainsi: 


- une maquette de traitement des courbes est réalisée associant 6 circuits pour 
transformer des images 512 - 512 à la volée /T. IZIQUEL] 


- le circuit crossbar [A. SAFIR] a été testé avec succès dès son retour de Yale. 
Malheureusement, la technologie choisie qui transite par MOSIS ne permet pas de série 
industrielle sauf à réadapter la conception chez un fondeur 


- le processeur élémentaire du calculateur fonctionnel a été défini dans une version 


"large" basée sur un ensemble représentatif d'algorithmes de traitement bas niveau /E. ALLART]. 


Les principes du contrôleur "flot de données" sont acquis et les évaluations des fondeurs 
potentiels sont achevées [G. QUENOTJ.. Soulignons que la première version réalisée courant 
1989 pourrait être réduite dans le but de mieux vérifier les contraintes d'un ensemblier qui en 
serait le premier utilisateur. En même temps que les premières simulations et estimations, nous 


poursuivons les analyses systématiques d'algorithmes sur le simulateur. fonctionnel du 
calculateur. | 


La rétine neuronale justifiait des optimisations qui auraient pu remettre en cause jusqu'à son 
principe (changement de norme intervenant dans la minimisation par exemple pour une 
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meilleure compacité). Ce problème résolu, nous avons conçu quatre circuits dessinés au 
micron, dont une rétine test 16X16. 


Les autres conceptions de type cellulaire ont été menées à bien avec, notamment à l'IEF : 


- le dessin de circuits de B-codage à inhibition latérale et la préparation d'une rétine TCL 
de grande taille (environ 100 x 100), qui pourrait être implantée sur wafer. 


- l'élaboration du processeur élémentaire de SPHINX modifié pour une plus grande 
compacité et pour des contraintes issues du logiciel de base de la machine complète. 


Les résultats en matière d'architecture logicielle sont plus diffus correspondant à l'état des 
dispositifs décrits précédemment. 


Sur HECATE, les problèmes étaient naturellement liés au processus d'incorporation 
progressive de nouveaux modules que nous avons souhaité normalisé fs. DACIC, E. VALETTE]. 
Chacun des modules de la machine HECATE est constitué, entre autres, de circuits rapides de 
traitement du signal et/ou de circuits intégrés: l'assemblage de ces modules doit ainsi permettre 
un parallélisme de degré élevé. Le GENérateur d'Interfaces Utilisateurs Spécialisés (GENIUS) 
que nous avons donc développé permet, indépendamment de la nature du module, suivant un 
modèle bien précis, valant presque norme, de configurer et de piloter ces différents ensembles 
hétérogènes; ce modèle, basé sur des notions d'actions intuitives, exploite un accès graphique 
aux architectures, paramétré en accord avec les logiciels d'interface dont les types, en nombre 
restreint, sont répertoriés définitivement. 


Quant aux derniers développements système sur la machine de commande et de contrôle du 
dispositif, ils concernent l'adaptation de UNIX système V à l'environnement matériel et logiciel 
nécessaire au système CHORUS D. IRLANDE]. Pour cela, un nouveau noyau UNIX a été codé 


après examen et modification des points suivants: (adapatation des résultats déjà acquis sur 
UNIX V7). 


- Gestion mémoire: prise en compte de l'architecture machine imposée par CHORUS 
(multiprocesseurs, mémoires locales à double accès, mémoire globale). 


- Communications interprocesseurs: signalisation d'événements sur interruptions et ajout 
de nouveaux appels systèmes. 


L'évolution réseau a été marquée par l'adjonction d'une seconde machine quadriprocesseur 
pouvant dialoguer sur le réseau grâce à un logiciel de communication spécifique (service 
TCP/IP) développé sur le modèle client/serveur à l'aide du mécanisme des "sockets" [H. 
VILAMOSA, D. IRLANDE]. 


Ce travail a supporté l'extension, dès la mise en service d'un calculateur SUN coordonnant les 
deux SM 90 et incluant l'aide à l'utilisateur et la base de règles, sans autre écriture que celle 
d'un automate de routage qui aiguille les messages vers les acteurs concernés. 


Dans le domaine de l'aide intelligente aux utilisateurs, le logiciel OSIRIS a été testé quant à 


"Sa généralité: après la configuration de systèmes électroniques complexes, on l'a essayé dans 


une application d'assistance à la gestion d'un centre d'essai [J.M. FRECAUT]. Il fait maintenant 
l'objet d'un transfert pour devenir un progiciel général susceptible de participer à divers 
interfaces homme/machine dont il accélérerait la mise en place. 


La programmation cellulaire a évolué dans un sens résolument algorithmique qui nous permet 
ici de faire le lien avec les activités correspondantes; mais pour en terminer avec l'avancement 
des recherches en logiciel, signalons que les études sur le parallélisme ont pris une dimension 
suffisante pour justifier à notre avis, la compétence de l'équipe augmentant , la mise en place 
d'un calculateur massivement parallèle de type hypercube: la "Connection Machine" de TMC 
issue du MIT. Elle serait installée dans un environnement du genre atelier inter-organismes sous 
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Visualisation dynamique d'informations | : 
par une maquette logicielle expérimentale d'aide à la préparation de mission 
du Bâtiment d'Essais et Mesures "Le Poincaré" 


. 


Le programme reproduit le raisonnement "graphique" des utilisateurs pour traduire, à leur bénéfice, les différentes 
contraintes (élimination de zones), intégrer la trajectoire d'objets, déterminer interactivement le meilleur cap en 
fonction des masquages d'aériens. ‘.. 











le contrôle scientifique d'un comité d'arbitrage des projets, avec possibilité pour les équipes 
intéressées de réaliser des montages expérimentaux périphériques. 


En algorithmie de traitement d'image, cellulaire d'abord, nous avons multiplié les 
exemples d'implantation pyramidale d'opérateurs de segmentation et d'analyse /P. CLERMONT]. 
On dégage ainsi peu à peu les primitives de ce qui pourrait devenir un langage incluant ses 
propres outils de communication et relevant d'un modèle précis de parallélisme. Ces résultats 
ont permis, comme déjà mentionné, d'influencer des choix lors de la refonte de l'architecture 
matérielle du processeur élémentaire. 


Dans le même temps, l'activité "rétinienne" s'est concentrée sur deux axes non disjoints /A. 
REICHART] 


- compréhension des images en demi-teinte 


Nous utilisons une famille de TCL qui, appliqués de façon itérative sur une image en demi- 
teinte, permet d'obtenir une image ayant la structure d'un motif seuillé (noircissage). 


- vers une intégration d'un processus complet de vision 


D'une part, nous poursuivons l'analyse d'images réelles seuillées, avec l'exemple des images 
de caractères imprimés, pour définir précisément l'ensemble des algorithmes et de l'architecture 
nécessaires pour développer une classe d'application (reconnaissance des formes, vision 
d'alarme). D'autre part, nous voulons utiliser les méthodes de reconnaissance pour réaliser une 
poursuite de cible, avec un rafraîchissement périodique de cette reconnaissance. 


Au cours de ces développements, de nombreux opérateurs d'applications variées ont été 
prouvés codables sous forme de TCL et pourraient ainsi élargir la batterie des fonctions de base 
d'une rétine. Notons également que les principes de l'interpréteur Rétina dérivé de Yacc mais 
générant des versions compilées de code exécutable, écrit pour supporter le simulateur des 
rétines, ont été repris comme noyau logiciel lors du transport déjà mentionné de 
l'environnement de programmation image du SEL 32 vers VINIX/SUN, améliorant ainsi 
l'homogénéité de ce dernier. | 


Enfin, le traitement d'images plus conventionnel voit ses moyens renforcés avec 
l'installation de LAMPION. Le laboratoire a repris la programmation systématique d'opérateurs 
de segmentation et d'outils plus généraux avec l'idée de constituer un fond réutilisable 
systématiquement par tous lors du traitement d'applications {C. THOMAS]. Ceci concerne la 
détection de contours et de régions et surtout l'analyse de mouvement et de déformation qui 
reste un intérêt privilégié de cette équipe. De même, les essais de vision préattentive [C. 
MILLOUR], intéressant la spécification de systèmes de perception efficaces, sont généralisés par 
l'exploitation de configurations géométriques locales et non plus seulement de champs de 
vitesse grossièrement estimés. L'information image est scrutée à différentes échelles 
engendrant une transformation efficate séparable: le crible. Puis les informations résultats 
partiels sont intégrées dans un processus global d'estimation. Les productions disponibles 
issues des diverses études servent déjà, notamment les extensions de filtres classiques, pour 
l'analyse de cibles en formation {B. HOELTZENER-DOUARIN] ou de phénomènes magnétiques 
dans le soleil /8. COLLIN]... Associé aux techniques de maintien de modèle, ce lot d'opérateurs 
exécutables géré par LAMPION, devrait permettre la constitution progressive aisée de 
programmes de reconnaissance du type ACRONYM. Dans l'intervalle, cet environnement de 
programmation permet l'écriture et le test de nombreuses solutions tant recherche 
qu'industrielles. 


Parallèlement, l'année écoulée est marquée par le transport et la remise à niveau de l'outil de 
synthèse d'images avec notamment le transfert d'outils de modélisation géométrique 
développés sur machine LISP pour le multicapteurs {A. LANUSSE], et l'uniformisation des 
logiciels sous UNIX, l'extension au visible supportant entre autres les études de flou déjà 
citées et la régénération de scènes vues d'un mobile aérien par divers capteurs /P. THEVENOUXI. 
Cette extension limitée dans un premier temps, a pris une dimension plus importante âvec 
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l'écriture d'un algorithme de ray-tracing optimisé [0. DEVILLERS] et une coopération avec À. 
Gagalowicz à l'INRIA. 


A3 Commentaires et Conclusion 


Pour conclure cet état des études , soulignons encore que les transferts s'accentuent dans 
presque tous les domaines d'activité: 5 thèses ont été soutenues; les résultats en contrôle 
intelligent [A. LANUSSE, X. MERLO] et aide à l'utilisateur {J.M. FRECAUTJ devraient être 
implantés sur une version future d'un moyen d'essai; l'Aérospatiale, la SAT, sous l'égide de la 
DGA détachent au laboratoire des ingénieurs en formation pour des applications de poursuite ou 
de navigation avec imagerie qui mobilisent LAMPION et l'outil de synthèse; certains produits 
sont repris par des PME avec succès et une architecture intégrée pourrait être incorporée à un 
système d'armes en cours de conception. 


Tout ce tableau ne saurait cacher les difficultés qu'a rencontrées le laboratoire Système de 
Perception ces dernières années pour être reconnu au sein de la politique de la DRET comme un 
organisme utile, voire indispensable à la préparation de l'avenir dans la DGA, pour trouver sa 
place au sein de l'ETCA malgré ses modalités de fonctionnement et ses objectifs à certains 
égards originaux pour un tel établissement dont les missions sont multiples, et par voie de 
conséquence pour être reconnu parmi les laboratoires de recherche de l'Etat dans les domaines 
où il est compétent. Plusieurs éléments d'explication à cela peuvent être proposés. Nous 
n'évoquerons que les causes internes, les autres, telles le relatif éloignement des universités et 
autres écoles, la difficulté d'accéder à des instances d'orientation de la recherche nationale. 
apparaissant plutôt comme des conséquences et résurgeant d'ailleurs en filigranne. 


De gros efforts ont été faits pour qu'une recherche spécifique de Défense puisse exister, et dès 
lors qu'elle existait pour qu'elle ne manque pas le rendez-vous majeur de la robotique pendant 
que les organismes de développement et l'industrie militaires finissaient de digérer 
l'informatique et sa révolution. 


De très gros progrès ont été accomplis, ne serait-ce que l'existence de ce laboratoire depuis 
bientôt trois ans après quatre d'un difficile regroupement d'équipes autour d'un nouveau thème, 
la remise à jour récemment des missions de l'ÉTCA où la recherche figure maintenant, la 
constitution d'un centre de recherche à Arcueil. Peut-être le plus significatif d'entre eux a-t-il été 
la première réunion, en Mai 88, du comité scientifique du laboratoire sous la présidence du 
professeur PAIR; que tous ses membres soient ici remerciés de leur participation à la journée 
marathon où l'ensemble de ces activités a été présenté et d'ailleurs approuvé. 


De très gros progrès restent à accomplir pour que les acquis ne perdent pas leur substance 
comme l'a fait néanmoins remarquer le conseil. Avant tout, il faudrait pallier la pénurie 
d'encadrement de recherche: d'une part fabriquer des professionnels et tirer parti des rares 
disponibles, d'autre part trouver un équilibre fructueux (i.e. stable mais dynamique) entre les 
nécessités des corps de l'armement ou les traditions des personnels civils, les impératifs de la 
DGA et les contraintes qu'imposent les activités de recherche. Ce sont deux conditions clés 


d'une gestion correcte du capital tant concret qu'intellectuel que représente un laboratoire en 
activité. 


À l'heure actuelle, des rotations de personnels trop importantes bien que nécessaires pour 
d'autres impératifs, sont sources d'instabilité, car difficilement gérables, elles entraînent une 
perte de savoir-faire. Des transferts hâtifs des recherches vers des applications prématurées, 
sont d'autant plus néfastes qu'ils sont prônés par certains décideurs soucieux de 
"rentabilisation" immédiate. Or, le manque de cadre, la simple non-définition de carrières de 
recherche et l'ambiguïté des rôles, se traduisent alors immédiatement en baisse d'activité 
créative (nombre de publications, promotion du laboratoire dans la DGA, taux de coopérations 
extérieures universitaires ou industrielles...) dès qu'il faut réaliser, voire simplement gérer. 
Cependant, des phases de rentabilisation sont indispensables et fréquentes pour un laboratoire 
de Défense, qui plus qu'un autre peut-être, joue le rôle de poisson-pilote pour les directions 
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opérationnelles et leurs industriels et doit donc convaincre avant tout. Les schémas de 
recrutement et de coopération sont mal adaptés, notamment pour cette mission de 
rentabilisation, si bien qu'aujourd'hui, le laboratoire manque déjà de personnel pour exploiter 
les bancs expérimentaux et plus généralement, à peine créé, perd du dynamisme. 


Par ailleurs, les circuits d'alimentation en moyen et de décision sont trop longs et souvent 
diffus. La gestion de la recherche s'accomode volontiers de modèles du type entreprise, 
(mobilité roborative, adaptabilité maximale, actions quasi instantanées) alors que 
paradoxalement, elle demande des soutiens dont, en Europe, pratiquement seuls les Etats 
peuvent garantir la stabilité . Accepter la mobilité sans la rapidité de réaction apparaît à l'usage, 
rédhibitoire. | 


Pourtant, les solutions proposées lors de la création du laboratoire Système de Perception ont 
prouvé leur intérêt, et il suffirait d'aménagements légers de l'existant pour que l'ensemble soit 
viable et conforme aux règles et usages. 


D'une part, nous proposons un regroupement des ateliers en deux équipes, respectivement 
"technologie" et "contrôle et application" de la perception; ceci permettrait de limiter les besoins 
et en même temps de mieux préparer l'évolution vers les robots mobiles , tout en créant une 
place pour la biologie, ses modèles et sa propre technologie dans un cadre dont l'essor 
neuronal n'est qu'un élément. Nous proposons d'institutionnaliser et de stabiliser un flux de 
personnels de petites ou moyennes industries, quitte à en faire créer. Enfin, nous envisageons 
des rapprochements désormais officiels avec les milieux plus traditionnels tels qu'université, 
école d'ingénieur ou CNRS. 


D'autre part, il nous paraît nécessaire de: 
- aménager les relations avec les industriels, dans le cadre national et peut-être européen 
- Simplifier les procédures administratives dont le poids est excessif 
- définir les positions de chercheurs dans la défense et organiser leur rayonnement 


Ces objectifs nous semblent vitaux pour l'avenir dans une période où la charge "cognitive" 
dans les systèmes croît bien plus vite que la charge "pugnitive”. 


B. Zavidovique 
Février 1989 


Photos ci-contre : Les Frontières de la Liberté! : 


Détection fruste de points de contraste pour la reconstruction rapide de 
Contours par chaînage exploitant une détection de régions simultanée. Cet 
algorithme est une variante de la segmentation dans l'algorithme de poursuite 
précédent. : 

( a ) Original | 

( b ) Maxima locaux de gradients directionnels 

( © ) Points de contraste étiquetés | 
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Premier essai multicapteur sur banc: 


association accoustique (antenne 6 microphones) 
vision (caméra 5 axes: site, azimut, focale, mise au point, ouverture) 








B . ACTIVITES DE RECHERCHE ET DEVELOPPEMENT 


B1 Activités multicapteurs 


( Coordinateur A.Lanusse ) 


La présentation de nos activités prend résolument pour cadre le projet "plateforme multicapteur”" 
du laboratoire "système de perception" de l'ETCA. Cette machine est conçue comme un moyen 
d'étude des problèmes de la perception, centrée autour de la Vision, avec notamment la 
réalisation d'un ensemble allant de l'acquisition d'une information visuelle à la prise de 
décisions. Nous voulons que la machine "voyante" puisse analyser son environnement à partir 
d'un ou plusieurs capteurs optique, et en cas de besoin confronter ses résultats à ceux d'autres 
capteurs ou demander leur aide. Ce but est en fait très complexe. Sa réalisation complète 
demande de faire intervenir non seulement des primitives de traitement d'images, mais aussi un 
système d'intelligence artificielle pour "comprendre" le monde extérieur, c'est-à-dire relier des 
résultats de perception (présence, position de forme, mouvement...) à un ensemble de 
connaissances acquises (une base de données). Ces connaissances seront accumulées par 
apprentissage au cours d'une phase de calibration ou au contraire elles seront imposées a priori 
de façon statique. Dès le début du projet a également été pris en compte le fait que la vision du 
système ne peut qu'être diversifiée. Pour certaines applications, elle se doit d'être fruste. En 
fait, cela traduit non seulement une notion de simplicité, mais surtout de rapidité. La qualité du 
traitement sera sacrifiée en partie à sa rapidité. Le robot doit par exemple réagir à l'apparition de 
caractéristiques inquiétantes (mouvements brusques ….). Pour d'autres au contraire, elle se doit 
d'être analytique, (pour reconnaître un objet particulier dans un vrac, puis le saisir ..). Cela 
demande, on le verra, des prises de décision parfois complexes au niveau des changements de 
modes de fonctionnement de la vision, lorsque le nombre de capteurs est faible comparé au 
volume des sollicitations extérieures. 


BI.1 Montages expérimentaux 


B1.1.a Sous fonctions complètes de perception 


Résultat de notre réflexion sur la perception multicapteurs, le concept original de sous fonction 
complète de perception a été introduit. Il se traduit par une maquette préliminaire regroupant un 
ou plusieurs capteurs, les actionneurs de configuration de ces capteurs (dans le cas d'une. 
caméra : site, azimut, zoom motorisé à 3 fonctions: diaphragme, focale, et mise au point), et les 
traitements de données capteurs (pour en extraire des informations significatives (de détection, 
de localisation ou de classification) pour le problème, qui viendront s'intégrer en temps réel 
dans le modèle) et les boucles de commande actionneurs. 


Dans le cadre de nos préoccupations, 3 sous fonctions ont plus particulièrement été examinées: 
perception 3D, poursuite par vision, et couplage acoustique-vision. Elles ont été choisies à 
l'issue d'une réflexion sur les applications à moyen terme de la vision, essentiellement en 
matière d'analyse de scènes et de robotique mobile, qui a montré la nécessité pour obtenir une 
perception correcte en environnement non contrôlé de doter le capteur caméra d'actionneurs de 
configuration, éventuellement pilotés selon des informations extérieures. 


1) Perception 3D | 
La restitution de l'information de surface par mesure de la profondeur par vision est 
particulièrement attrayante de par son caractère passif. Plusieurs procédés sont envisageables, et 
ont donné lieu à des analyses préliminaires. Le flou de mise au point apparaît lorsque que le 
plan d'observation est différent du plan image, il dépend de la taille du diaphragme. En effet, si 
on place le plan d'observation à la distance vm alors l'image du point objet P est une tache 
circulaire de diamètre : | | 











Dt=W-vmle [D diamètre de la pupille de sortie,vm distance du plan d'observation au plan 


principal image (ou à la lentille)] . On peut envisager d'utiliser une mesure de flou autour d'un 
point d'intérêt, et de jouer sur le paramètre de mise au point jusqu'à minimiser le critère utilisé. 


S1 la profondeur de champ est faible, on peut remonter avec une précision acceptable à la 


profondeur du point d'intérêt. Plusieurs critères d'estimation du flou ont été testés et comparés 
[Tonchia 88]. | 


lentille et pupille plan d'observation 
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Géométrie De l'Imageur 


ne [z distance du point objet au plan principal image (ou à la lentille), 
nt : P J princip 


v distance du point image au plan principal image (ou à la lentille), f distance focale ] 


En appliquant la relation de conjugaison on a: + 


2) Poursuite par vision 


De même dans la perspective de l'observation d'un environnement non contrôlé, qui ne peut 
plus légitimement être supposé statique, l'identification d'un mobile ne peut que rarement 
s'effectuer sur une seule image; il faut au contraire accumuler de l'information au cours du 
temps jusqu'à obtention d'indices suffisamment discriminants. Le capteur vision doit donc être 
doté de boucles de poursuite permettant d'asservir la position et la configuration de la 
caméra aux caractéristiques de l'objet poursuivi (position, taille, etc), pour mener à bien 
différents types de poursuite (site et azimut ou site et azimut et taille:constante). Si la poursuite 
peut s'effectuer avec un champ de plus en plus restreint au cours du temps, 1l en va 
différemment de la détection. C'est pour cela que nous avons commencé à évaluer le couplage 
entre caméra grand-champ (dotée d'un objectif grand angle à focale fixe type fish-eye) et 
caméra petit champ, et plus particulièrement à analyser les problèmes géométriques posés. 





Vue Fish-Eye de Synthèse d'un objet 3D 
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Sur le plan des traitements, un mécanisme de vision préattentif, basé sur l'analyse du flot 
optique, a été développé [es C1.3, C1.5] pour détecter des zones d'intérêt dans une séquence 
d'images. Des fenêtres sont centrées sur ces zones d'intérêt, et les traitements de reconnaissance 
sont ensuite appliqués à l'intérieur des fenêtres. L'avantage de cette approche nouvelle est 
double: tout d'abord augmenter la rapidité de traitement par une application locale des 
opérateurs, et ensuite permettre le paramétrage fin des traitements pour les adapter au contexte 
de la fenêtre courante et en obtenir des performances optimales. La gestion des fenêtres, des 
opérateurs de traitement disponibles, et de leurs résultats pose des problèmes complexes de 
contrôle perceptif, un véritable système d'exploitation "orienté perception" est actuellement en 
cours d'implantation sous UNIX. 


L 





analyse de scène 
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connaissances 
a priori 


détectio 

objet zoomlipoursuite 
mesure mise 
du flou au point 
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diaphragme 
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gain 






décision 











Synoptique de la Caméra à 5 Degrés de Liberté 
Commandables par Calculateur 


3) Couplage Acoustique-Vision 


Les activités du laboratoire en matière de vision, ont très tôt fait apparaître les problèmes posés 
par la nécessité de configurer correctement le capteur caméra (site, azimut, mise au point, 
ouverture, distance focale) pour obtenir des informations exploitables. D'où la nécessité de 
rechercher d'autres types de capteurs susceptibles de pallier ses insuffisances et de lui fournir 
des informations de configuration, sinon certaines, tout au moins plausibles. Bien que de 
maniement difficile, l'acoustique est apparue comme particulièrement intéressante, de par son 
caractère passif et son faible coût. Par le passé ont été plus particulièrement étudiés les 
problèmes posés par la localisation de sources sonores par une antenne acoustique linéaire, 
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Détection de sources sonores 


Estimation des signaux d'attaque des microphones ( diagonalisation de la matrice de corrélation et calcul des racines du 
"polynôme MUSIC" ) 


Seules les racines de module 1 ont une réalité physique. 


( a ) 3 sources idéales en simulation 
( b ) 2 sources faiblement bruitées ( à 0,5 et 1 radian ) 


( c ) 2 sources fortement bruitées ( à O0 et 1 radian) 


die bide: à Gé Ré ET: CCC dde dE ne 








avec des "méthodes à haute résolution", déjà utilisées en hyperfréquences permettant 
d'estimer le nombre de sources, ainsi que l'angle d'arrivée d'ondes planes multiples sur une 
antenne linéaire à N capteurs. Nous avons travaillé en local fermé, environnement acoustique 
nécessitant l'emploi de telles méthodes, comme on le verra ci après. Ces méthodes reposent sur 
l'étude de la matrice de covariance des signaux mesurés sur chaque capteur et 
nécessitent de disposer d'un nombre d'observations au moins égal au nombre de 
sources à identifier. L'hypothèse de sources indépendantes, dans laquelle les divers 
bruiteurs sont considérés comme statistiquement indépendants, est courante. Il existe une 
situation différente où, à chaque source correspondent M sources fictives dues aux réflexions 
multiples du signal initial sur différents obstacles se trouvant dans le milieu. Des premiers 
résultats encourageants ont été obtenus concernant la discrimination du 
bruiteur principal et l'estimation de son site qui rendent envisageable 
l'utilisation d'une antenne acoustique comme dispositif de désignation 
d'objectif bruyant à une caméra à champ de vue restreint, même en présence 
d'échos.[ 6 C1.4, C1.5] 


B1.1.b Description de l'expérimentation 


Pour reprendre une boutade maintenant célèbre, "la vision ne se réduit pas au traitement 
d'images", et il est indispensable de prendre en compte les problèmes de configuration 
des capteurs, en vue en particulier de leur contrôle actif. Indépendamment de toute 
connotation anthropomorphique, telle que le déplacement des points de fixation, et le contrôle 
des mouvements de vergence dans un système de stéréovision, ou des mouvements 
d'accomodation dont l'importance est maintenant reconnue en estimation de la profondeur, il est 
clair que le contrôle actif des capteurs permet, bien souvent, de simplifier les traitements, et doit 
donc être une partie essentielle de tout système de perception. Afin de pousser plus avant la 
réflexion, nous avons décidé de tester notre système sur un scénario de surveillance de scènes 
dynamiques volontairement simplifié. On dispose de N sites sur un mur; un site est défini 
comme un objet détectable, localisable, et reconnaissable à la fois par acoustique et par vision. 


Rampe de micros 


Site inactif 





Site actif 





Sites d'activité composant l'environnement 
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Sie 1 


Site 2 


Site 3 


Site 4 








Sie 6 


Diagramme D'activité Des Sites 


Une requête perceptive sera considérée comme satisfaite lorsque les 2 capteurs auront donné des 
résultats non contradictoires. 


! ACOUSTIQUE ! VISION 
Détection ! Discontinuité Sonore ! Ampoule Allumée 
Localisation ! Méthodes Haute Résolution ! Position de L'ampoule 
Classification  ! Energie dans Bande Fréquences  ! Forme du Haut-Parleur 


L'un des intérêts de ce scénario réside dans le fait que 2 capteurs peuvent répondre 
indifféremment à une requête de détection, de localisation ou de classification, mais que suivant 
la position du site, et la configuration courante du système, on ne sait pas a priori quel est le 
premier qui répondra. Les incertitudes des 2 types de capteurs peuvent d'autre part être 
différentes, enfin il y a pour chaque capteur plusieurs façons d'opérer l'analyse avec des 
configurations diverses. Pour la vision. il pourra, par exemple, y avoir compétition entre 2 
modes de détection: | 


. À champ de vue réduit, on balaye le mur jusqu'à trouver une ampoule allumée 
que l'on amène au centre de l'imageur pour la localisation. On peut alors lancer une 
classification (discrimination sur formes 2D (cercles, triangles, rectangles)) sur la cible 
supposée avoir une taille suffisante dans l'image. 


À champ de vue important, on détecte une tache lumineuse sur le mur, puis on 
fait ensuite un zoom sur la zone détectée pour lancer une classification. | 


Il faudra donc ici trouver un compromis optimal entre déplacer et zoomer. Compte tenu du 


caractère dynamique de la scène, on voit alors bien que les temps relatifs d'obtention d'un 
résultat dépendent des circonstances (position de la cible, conditions d'éclairement, etc). 
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B1.1.c Architecture logicielle 


À une décomposition très classique en perception, décision et action, on a préféré un modèle 
hiérarchique de décomposition en sous-tâches, qui décentralise la décision dans des boucles de 
bas niveau. Ce qui veut dire qu'au bas niveau, là où le flot des données est très important, et où 
il faut être très rapide dans les calculs, des capteurs ou des traitements simples peuvent être 
utilisés. Bien sûr, ces asservissements rapides sont pilotés par des traitements plus complexes, 
notamment au moment des transitions dans ces bouclages de bas niveau, qui ne sont pas prises 
en compte dans leur modèle trop simple du phénomène suivi. Par exemple, une boucle de 
poursuite vision ou autre peut être lancée et supervisée, ou paramétrée par un module de 
détection et d'analyse multiobjet de la scène. L'architecture fonctionnelle envisagée pour le 
système PARIS [ 6 C1.6] autorise au niveau de la programmation, la prise en compte des 
résultats de perception en vue de l'action. C'est pourquoi on s'inspire actuellement, pour la 
conception de ce système, à la fois des représentations d'analyse d'images ou de signaux et de 
programmation de robots, pour étudier l'utilisation de sources de connaissance multiples et la 
réaction aux variations de l'environnement par réglage ou reconfiguration. 


Pour valider les algorithmes développés, des études ont été conduites sur des simulations 
informatiques, en l'absence de la plate-forme multicapteur “physique”. Cette démarche est 
parfaitement valide à condition d'observer une certaine rigueur dans la conception de ces 
simulations. On doit bien spécifier le modèle qui est simulé, ainsi que les critères qui permettent 
de vérifier l'adéquation et l'efficacité des méthodes utilisées. Cela est fait couramment, par 
exemple en intelligence artificielle avec des exemples d'école. Les simulations réalisées [ 6 
C1.2] autour de la plateforme Multi-Capteurs avaient un caractère numérique, puisque la 
performance était donnée par la valeur moyenne de la fonction de coût associée aux techniques 
d'automatique utilisées. Mais d'autres aspects décisionnels, tels que le choix des opérateurs ou 
de leur ordre d'application, à caractère plus discret, et utilisant des connaissances a priori 
doivent être pris en compte dès la phase de conception (Modèles Logiques). L'ensemble de cet 
effort permettra que la plate-forme PERCEPT soit contrôlée par le système PARIS, dès son 
arrivée en 89. 


B1.2 Mécanismes de décision 


B1.2.a Exploitation de connaissances a priori; aspects symboliques 


Nos activités dans ce cadre [ 63 C1.1] ont surtout porté sur l'étude des mécanismes permettant à 
un automate que nous appellerons Robot de 3ème génération de suivre les changements de son 
environnement et de s'y adapter au mieux. Cette flexibilité ou capacité d'adaptation est en fait le 
début de ce que l'on appelle communément un comportement “intelligent”. Pour être capable de 
s'adapter ainsi, 1l faut être à même de percevoir et/ou de traiter des informations fournies par un 
opérateur extérieur; 1l faut ensuite être capable d'extraire de la masse d'informations ainsi : 
acquises les traits discriminants qui permettront la caractérisation, ou l'identification de la scène 
ou de certains de ses composants, d'où les problèmes d'interprétation que nous avons étudiés 
en distinguant les approches précompilées basées sur une extension de la notion de 
questionnaire, des approches combinatoires ou subsymboliques. L'adaptation, c'est aussi la 
capacité de suivre au mieux sans décrocher l'état réel d'un système auquel on n'a accès 
qu'indirectement, soit du fait de sa nature même et de son inobservabilité, soit en raison de bruit 
ou d'erreurs de mesure, et c'est là typiquement un problème de filtrage, dans lequel on a montré 
[ 62 C.1.2T que les techniques bayésiennes jouent un rôle très important. Toutefois le problème 
des changements qualitatifs, pose le problème de l'interfaçage avec un niveau symbolique 
susceptible de prendre les décisions de reconfiguration. Ceci suppose toutefois de pouvoir 
effectuer des raisonnements ou des inférences en exploitant des connaissances a priori en 
présence de données pouvant évoluer, qui sont entâchées d'incertitudes, etc. 


Ce domaine d'activités est en quelque sorte complémentaire de celui consacré aux 
modèles probabilistes et essaie de répondre à la question: que ne peut-on faire avec des 
modèles probabilistes? De l'infinie variété de nuances prises en compte par les 
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modélisations probabilistes, les systèmes logiques ne retiennent qu'un nombre limité de 
possibilités (en ce sens, il y a bien compression d'information), et les règles d'inférence 
permettent de combiner les nuances de vérité des énoncés, de même que la loi de Bayes permet 
de combiner les probabilités d'évènements. Et ceci est particulièrement important pour un robot, 
car si les nuances de vérité des motivations peuvent être infinies, la décision en vue de l'action 
est elle binaire (On agit ou on n'agit pas), les nuances pouvant éventuellement porter sur les 
modalités de l'action (comment agit-on?). Dans ce passage du continu au discret, autrefois 
abordé par le biais de la logique à seuil, il ne faut pas oublier également la prise en compte des 
relations pouvant exister entre les objets, et les façons de les modifier (Génération de Plans). 
Nous sommes donc amenés à nous poser la question initiale sous une forme nouvelle: dans 
quel cadre peut-on effectuer des raisonnements ou des déductions sur des 
connaissances incomplètes, ambiguës ou entachées d'incertitude, en vue de 
l'action? Le problème posé par les systèmes de perception est justement celui des 
connaissances pouvant être remises en cause au cours du temps sur la base d'informations 
nouvelles (l'univers évolue), des résultats de reconnaissances ambiguës provoquées par des 
confusions entre capteurs. C'est aussi celui des incertitudes, qui ne peuvent pas toujours se 
formuler à l'aide de lois probabilistes parfaitement inadaptées aux cas où l'on sait que 
l'évolution de l'état d'un système est parfaitement déterministe dans un ensemble discret de 
valeurs, mais fonction d'excitations en provenance de l'environnement qui elles peuvent être 
inconnues. Les systèmes logiques retrouvent alors tout leur intérêt et toute leur puissance. La 
nécessité de formes de raisonnement non-classiques dans l'interprétation et l'exploitation des 
résultats de la perception apparaît rapidement en raison essentiellement de 2 facteurs: les 
incertitudes, les ambiguïtés, et le caractère nécessairement limité des résultats de la perception, 
ainsi que la nature souvent approché et vague des connaissances a priori formulées par le ou les 
programmeurs, et utilisées par le système de prise de décision. Les sources d'incertitudes sont 
nombreuses en perception, qu'il s'agisse d'erreurs dues à la précision forcément limitée des 
capteurs, ou résultant de défaillances éventuelles ou encore en raison de limitations intrinsèques 
(champ de vue restreint, mauvaise configuration, temps de mesure (notion de temps critique), 
etc). 

Il est donc nécessaire de prendre des décisions cohérentes, et d'effectuer des 
raisonnements sur la base d'informations incomplètes, ambigües ou entachées 
d'erreurs, c'est même là une des caractéristiques essentielles de l'intelligence. 
En particulier la couche supérieure d'un système de perception doit utiliser des connaissances a 
priori de ce type, et faire des raisonnements à partir de ces connaissances, il est en effet 
indispensable dans la perspective d'une autonomie toujours plus grande que ces systèmes aient 
quelques aptitudes à prendre en compte l'incertain tout en "contrôlant" les conséquences de 
leurs actions ou de leurs décisions. Nous avons donc examiné quelques Systèmes Logiques 
exploitant les connaissances limitées ou variables (Modalités "Je crois", "Je sais"), 
Raisonnement Non Monotone (Logique des Défauts) sous-tendant des raisonnements 
cohérents, communément désignés sous le vocable de Logiques Non-Classiques. Les 
logiques Non-Classiques sont des systèmes logiques permettant de pallier certaines limitations 
des logiques classiques au niveau: | 


. des valeurs de vérité des énoncés (des nuances plus fines que VRAI ou FAUX peuvent 
être introduites: cas des logiques multivalentes). 


. de l'axiomatique (des systèmes d'axiomes plus faibles permettent de rejeter certains 
principes classiques tels que le principe du tiers-exclus (cas des logiques intuitionnistes) ou 
le principe de monotonie (cas des logiques des défauts). 


. des modes employés pour l'expression des énoncés (d'autres modes que l'indicatif 
peuvent être utilisés pour exprimer la nécessité, la possibilité, etc (cas des logiques modales)). 


. du domaine d'application (des systèmes de portée moins universelle que LP ont été 
développés pour effectuer par exemple la preuve de programmes). | 


IS ont fait leur apparition dans de nombreux domaines depuis l'informatique théorique jusqu'à 
la logique quantique, et sont d'un grand intérêt pour la manipulation et l'exploitation 
des connaissances a priori d'un Robot. L'exploitation, de préférence explicite, de 
connaissances à priori, généralement stockées sous forme déclarative reste le commun 
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dénominateur des approches IA, mais la question reste de savoir quels modèles, quelles 
connaissances utiliser, et comment les exploiter? Sans compter le problème de la représentation 
de ces connaissances ( 1) Réseaux sémantiques, frames, Langages Orientés Objet, ii) Règles de 
Production et Systèmes à Base de Règles, 111) Systèmes Logiques). Nous avons également 
incorporé des modèles logiques non Classiques au sein de techniques de reconfiguration 
pour s'adapter aux changements de l'environnement, ou de mission, qu'il s'agisse de 
reconfiguration en cours d'exécution (si elle est graduelle on parlera plutôt d'adaptation, 
et si elle est brutale on parlera plutôt de saut de fonctionnement), ou de planification 
d'actions en vue d'aider à la programmation correcte. 


B1.2.b Apprentissage et Controle Symbolique 


L'apprentissage est un domaine de l'IA maintenant bien établi, faisant l'objet d'une grande 
diversité d'approches. Le laboratoire étudie une application de l'apprentissage au contrôle 
adaptatif de processus, et plus particulièrement au contrôle de processus à base de règles de 
comportement | 63 C1.7, C1.8, C1.9, C1.10]. Le laboratoire a par le passé étudié les 
techniques d'apprentissage dans 3 cas: 


. un système de contrôle de processus à base de règles de comportement destiné 
au pilotage d'un robot de découpe laser. 


. l'étude d'un système d'exploitation à règles. L'idée consiste à contrôler 
identiquement un processus et l'ordinateur qui supporte l'application. Cette approche permet de 
coder de manière homogène l'ensemble des logiciels et adapte dynamiquement la puissance de 
calcul disponible aux tâches à fournir. Elle est mise en oeuvre dans une architecture 
multiprocesseur. 


. l'apprentissage de conduite de voiture, application actuellement développée sur 
la SYMBOLICS, avec des retombées probables en matière de navigation de robots mobiles. 


Ces travaux ont permis de dégager un certain nombre d'idées de base et de prouver leur 
faisabilité par la réalisation du système CANDIDE. 

Les systèmes de contrôle de processus sont confrontés à des applications de plus en plus 
complexes à appréhender. Il semble intéressant, par exemple dans le cadre de l'étude des 
phénomènes mal ou peu modélisés, d'avoir recours à des techniques d'informatique 
symbolique pour profiter de leur souplesse d'utilisation. 


Ainsi fut développé un système de contrôle de processus à base de règles de comportement 
destiné au pilotage d'un robot de découpe laser. Cette plateforme de recherche a validé les 
concepts de base et démontré leur faisabilité. 


La principale difficulté consiste alors à acquérir les règles de comportement. Ce problème de 
l'apprentissage peut être défini par les données qu'il manipule. Il part de grands ensembles de 
données (des points de mesure du phénomène), incomplets, bruités et de faible sémantique pour 
arriver à les synthétiser sous forme de quelques règles de comportement de haut niveau 
sémantique permettant de piloter le système. 


Sa résolution a nécessité l'utilisation conjointe de plusieurs techniques, respectivement les 
techniques numériques d'analyses de données pour débruiter et réduire la dimensionnalité de 
l'espace d'états, puis des techniques structurelles pour transcrire l'aspect temporel, modéliser 
les structures sous-jacentes et finalement des techniques d'apprentissage symbolique 
automatique pour trouver des regroupements conceptuels, généraliser et extrapoler les 
connaissances acquises. L'ensemble de ces techniques est mis en oeuvre par des techniques 
d'intelligence artificielle analysant les résultats de chaque phase grâce à des critères généraux 
décrivant conceptuellement chaque technique, ses résultats escomptés, et génère des plans 
d'actions pour guider l'apprentissage. | 


On pourrait caricaturer l'apprentissage comme suit : 
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REGLES PREMIER AGE ISSUES DE CANDIDE 


s regle PUT-ACC+ : si ACCELERATION < 1.99845 alors augmenter-PUISSANCE poids 7 
s regle PUT-ACC- : ei ACCELERATION > 2.44255 alors diminuer-PUISSANCE poids 7 







s regle PUI-FOR+ : si FORCE < 1918.5763 alors augmenter-PUISSANCE poids 7 
; regle PUI-FOR- : si FORCE > 2344.9265 alors diminuer-PUISSANCE poids 7 






: regle ANG-VIS+ : si VISION-POS-VOITURE < —0.3248 alors augmenter-ANGLE poids 8 
s regle ANG-VIS- : si VISION-POS-VOITURE > 0.9998 alors diminuer-ANGLE poids 8 
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(SETQ REGLES 
* ((BUI-ACC+ (< (LIT-PARAM ‘’ACCELERATION) 1.996845) (AUGMENTER-PUISSANCE) 7) 
(PUI-ACC- (> (LIT-PARAM ‘’ACCELERATION) 2.44255) (DIMINUER-PUISSANCE) 7) 
(PUI-FOR+ (< (LIT-PARAM ‘FORCE) 1918.5763) (AUGMENTER-PUISSANCE) 7) 
(PUI-FOR- (> (LIT-PARAM ‘’FORCE) 2344.9265) (DIMINUER-PUISSANCE) 7) 
(ANG-VIS+ (< (LIT-PARAM ‘’VISION-POS-VOITURE) -0.3148502) (AUGMENTER-ANGLE) 8) 
(ANG-VIS- (> (LIT-PARAM ‘VISION-POS-VOITURE) 0.9998497) (DIMINUER-ANGLE) 8))) 





(a) 









REGLES SECOND AGE ISSUES DE CANDIDE 


; regle ANG-VIS+ : si VISION-ANG-VOITURE < —0.0925 alors augmenter-ANGLE poids 13 
; regle ANG-VIS- : si VISION-ANG-VOITURE > 0.0925 alors diminuer-ANCLE poids 13 










+ regle PUI-VIT+ : si VITESSE < 13.0803 alors augmenter-PUISSANCE poids 10 
; regle PUIL-VIT- : si VITESSE > 13.5786 alors diminuer-PUISSANCE poids 10 







; regle PUL-VIS+ : si VISION-POS-VOITURE < —0.8888 alors augmenter-PUISSANCE poids 10 
; regle PUI-VIS- : si VISION-POS-VOITURE > 0.8764 alors diminuer-PUISSANCE poids 10 






(b) 


Candide s'améliore ( ci-dessus } 


(a ) premier jeu de règles élaboré par le programme, et ses résultats 


On ne dépasse pas le premier virage ( asservissement sur milieu de route, accélération, réaction de 
la route) car on réagit trop tard. 


( b ) deuxième jeu de règles construit par le programme d'après les résultats du premier 
Candide a changé de commande ( position par rapport au milieu de la route, angle par rapport à la ligne médiane, vitesse) et boucle 


désormais sur le circuit. 











Candide et l'expert ( p30 ) : Comparaison des résultats sur circuit difficile 


(a ) premier jeu de règles intuitif écrit par un expert 
( commande/milieu de route, accélération). Le virage est détecté trop tard. 


( b ) premier jeu de règles écrit par le programme d'après ses essais 
Pas d'anticipation car aucune "vision avant", d'où divergence de comportement dans un virage 


- l'apprentissage dirigé par les données (ADD) part des points de mesure du phénomène 
pour les regrouper via des analyses de données. L'utilisation concurrente de plusieurs méthodes 
permet la conception d'une algorithmie robuste au bruit et capable de commanditer les 
expériences à mener. Cette démarche n'utilise que des notions de propriétés abstraites 
concernant les ensembles de données, elle modifie leur mode de représentation en introduisant 
de nouveaux descripteurs adaptés aux méthodes d'apprentissage symbolique. C'est une 
reconnaissance de formes pour mettre en évidence de manière systématique et si possible 
exhaustive tous les états du système à contrôler, puis les regrouper en classes suivant la 
commande qu'ils requièrent. 


- l'apprentissage dirigé par le modèle (ADM) s'appuie sur le modèle vague'du 
phénomène à contrôler, examine ses bribes, les remet en cause et les confronte aux résultats 
obtenus par l'expérimentation. L'ADM génère de nouvelles hypothèses sur le phénomène 
physique. 


L'utilisation conjointe de ces deux démarches permet d'obtenir d'une part la complétude des 
jeux de règles (par ADD) et d'autre part la cohérence (par ADM). Les règles issues des deux 
approches sont exprimées sous un même langage, mises en oeuvre dans le système de 
commande et jugées sur résultat. Des mécanismes de "punition-récompense" calibrent les règles 
en fonction de leurs résultats, les affinent et remettent éventuellement les techniques précédentes 
en cause. 


Les premiers résultats de CANDIDE ouvrent de nouveaux champs de recherche en automatique 
avancée. 


Le premier d'entre eux consiste à perfectionner les mécanismes mis en oeuvre pour repondre à 
des contraintes d'efficacite de l'apprentissage, améliorer la robustesse de l'algorithme et mettre 
plusieurs outils d'apprentissage en compétition sur certains points particuliers. Il en découlera 
un connaissance plus approfondie des algorithmes d'apprentissage, l'implantation de certaines 
techniques encore manquantes et l'acquisition d'une expertise dans le domaine. 


Le second concerne plus l'automatique où il s'agit de faire un lien entre les techniques 
habituellement utilisées et les techniques de contrôle à base de règles. Cette étude évoque d'une 
part un aspect très théorique d'autre part des recherches très expérimentales quant à l'utilisation 
du contrôle à régles. Elle devrait permettre de mieux fixer la portée des travaux menés en 
contrôle avancé. 


B1.2.c Aide à l'Utilisateur 


Pour aider l'homme à maîtriser des systèmes de plus en plus complexes, on peut penser utiliser 
des techniques d'intelligence artificielle d'au moins 2 manières: 


utiliser des techniques déclaratives pour modéliser le système (caractérisation et 
identification) puis pour exploiter le modèle (contrôle effectif). 


. décrire de la manière la plus efficace, dynamique et adaptée le système à son 
utilisateur humain de manière à ce que celui ci assure le contrôle le plus sûr (sous réserve des 
contraintes de temps). | 


Si la première ressortit à l'automatique, la deuxième s'inscrit dans l'évolution des techniques 
d'informatique interactive et pose à terme le problème de la communication entre plusieurs types 
de logiciels possèdant chacun un type d'expertise. Une réflexion a été entamée , en liaison avec 
des praticiens du CTME [ 6 C1.1], sur l'apport des techniques d'aide à l'utilisation pour la 
mise en configuration des nouveaux types de radars, dotés de nombreux modes de 
fonctionnement (choix des formes d'ondes, des résolutions vitesse et distance, logiques de 
résolution des fausses alarmes, multifenêtrage, etc). La complexité accrue des problèmes 
perceptifs posés (poursuite multicibles, lever d'ambiguité en cas de leurrage, etc) conduit en 
effet à rechercher des mécanismes de gestion optimale de cette panoplie de moyens pour adapter 
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inom de la base de regles: standard 
incremnent sur les regles: 0.32 
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choix des parametres 

aleatoires: circuit etat du circuit visibilite champs 
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puissance mini (en KW): -132 

braquage maxi (en rd): 8.15707964 
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champs maxi (en rd): 1.80471976 
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au mieux les ressources perceptives au problème traité, à partir d'informations fournies par le 
radar lui même ou par d'autres capteurs. [ 6e C1.11] 


B1.2.d Modèles de fusion 


Dans de nombreuses applications de la perception telles que la poursuite où on réactualise 
constamment une estimée de variables telles que position-vitesse, la vision tridimensionnelle où 
typiquement on étudie le passage de l'image caméra (éventuellement combinée à d'autres 
capteurs) à une carte tridimensionnelle de l'environnement, les données de départ étant 
entachées de bruit, une question se pose: comment tenir compte explicitement de l'incertitude 
sur les mesures”? Plusieurs classes de problèmes nous amènent à soulever cette question: 

. étant donné un calcul à effectuer sur des données bruitées, comment tenir 
compte de l'incertitude sur les données pour mener à bien le calcul et obtenir l'incertitude sur le 
résultat? Le calcul du mouvement par appariement de primitives ou la reconstruction 
tridimensionnelle à partir des projections nous fournissent des exemples concrets du problème. 

. comment exploiter la redondance des données”? On est en effet souvent amené à 
exploiter des mesures de nature différente, 1l faut donc être capable de les utiliser pour obtenir 
une représentation unifiée. En particulier si on suppose que l'on dispose d'un certain nombre 
de sources S1, … , Sm qui donnent simultanément des opinions ou des degrés de 
vraisemblance eij e [0,1] sur n hypothèses H1, … , Hn, le problème est alors de calculer le 
facteur de certitude Ci de l'hypothèse Hi à partir des opinions sur Hi des différentes sources, 
pour déterminer l'hypothèse la plus probable par Maxi{Ci}. On souhaite bien sûr que le vote 
des différentes sources exprimé par les valeurs de Ci ait les propriétés souhaitées de 
Transitivité, Associativité, Ordre Total ( avec toutefois des difficultés: Cf Paradoxe De 
Condorcet). 

. comment obtenir une représentation cohérente de l'environnement? Si on veut 
construire et utiliser des représentations de l'environnement, on doit aussi être capables de 
reconnaître un objet particulier déjà répertorié et tenir compte de la nouvelle mesure obtenue 
pour mettre à jour la position de cet objet et l'incertitude sur sa position. 


Le problème majeur qui se pose en fusion multi-traitements est l'intégration de nouvelles 
observations au cours du temps et leur propagation pour maintenir la consistance. Cette remise à 
jour doit être robuste aux différentes erreurs ou incertitudes, [ 63 C1.1, C1.2] : une solution 
peut être de manipuler des distributions de probabilités. Si t est le vecteur d'état que l'on veut 
estimer, X l'observation du vecteur d'état en utilisant un capteur, P(t) la distribution de 
probabilités de t (qui résume les connaissances à priori sur t), f(xÎt) la distribution 
conditionnelle de probabilités de X ayant observé t (qui résume les connaissances sur le 
capteur), la formule de BAYES peut être utilisée pour estimer la distribution de t après avoir 
observé X ou distribution à postériori: 


P(tIX) = P(t). f(X | t}/m(X) où m(X) est la distribution de X. 


Aïnsi la meilleure façon choisie d'exprimer les connaissances a priori sur la nature des solutions 
est sous la forme d'une distribution de probabilités a priori Pf. Cette distribution avec une 
description probabiliste du bruit qui entache les observations permet d'utiliser la théorie de 
Bayes pour calculer la distribution a posteriori Pflg qui représente la probabilité de f étant 


données les observations g. De cette façon, on peut résoudre le problème de reconstruction en 
cherchant l'estimée f qui : 


. maximise cette proba a posteriori 
. minimise la valeur moyenne (relativement à Pflg) d'une fonction d'erreur 
appropriée. 


Ces techniques bayésiennes ont été appliquées avec succès à divers problèmes de fusion 
d'informations en vue du contrôle de capteurs (dualité filtrage- -commande), dans le cadre des 
activités MultiCapteurs du Laboratoire [ > C1.5]. On a essayé de valider ces idées sur une 
maquette de système de protection d'un navire contre les missiles mer-mer arrivant au ras des 
flots [ 63 C1.2]. Cette tâche pose deux problèmes principaux: 











- difficulté de détection (présence de la houle, cibles echos lorsqu'on utilise un radar de 
poursuite) 


- nécessaire rapidité de la détection et de la réaction 
Il s'agit bien d'un scenario d'intégration et de contrôle de la perception (bien sûr le problème 
réel est ici très schématisé et nous n'avons d'autre prétention que l'illustration de notre problème 


de perception robotique), donc adapté au sujet qui nous intéresse. 


On ne considérera que la surveillance d'un côté (180°). L'espace est subdivisé en secteurs 
polaires (voir schema). 





schéma de la simulation 


Les missiles arrivants seront caractérisés par: 
- leur angle 
- leur distance 
- éventuellement leur vitesse, si le coût de programmation n'est pas trop grand. Sinon on 


? 


se contentera de rajouter du bruit dans l'équation d'évolution du missile. 


De plus, on suppose que les missiles arrivent droit vers le navire. Les angles de ceux-ci par 
rapport au navire resteront donc constants. | 


Les capteurs choisis dans la simulation sont deux caméras (une à grand angle, l'autre plus 
précise) et un radar: 
- La camera grand angle couvre les 180° à surveiller, et n'a donc pas besoin d'être 
orientée. 
- La camera à téléobjectif donne une image plus précise, mais a besoin d'être orientée. 
- Le radar renvoit à chaque instant la distance des objets dans une seule direction (un 
secteur angulaire élémentaire). 


Le traitement derrière la vision renverra une indication de la présence ou de l'absence de missile 
dans le champ observé, la détection étant d'autant plus probable que le missile est proche, que 
l'angle de vision est petit et que les conditions météo sont bonnes (état de la mer, brouillard..). 
Il ne renverra donc dans un premier temps aucune indication de distance. Le télémètre renverra 
une indication de présence et de distance, elle aussi sujette à erreurs. À noter que l'on n'a 
aucune mesure de vitesse, qui pourrait se faire par exemple par effet Doppler. 


Le navire pourra de plus disposer d'informations sur la ou les directions privilégiées de la 
menace (connaissance a priori de la position et de la direction de l'ennemi). | 
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L'arme du système robotisé sera un canon à tir rapide orientable dans la zone surveillée, doté 
d'une certaine probabilité de coup au but si un missile est présent dans la direction visée. Le 
système devra de plus intégrer dans les calculs la quantité limitée de munitions. 


Les capteurs choisis sont frustes et sujets à erreurs. L'intégration devra donc se servir des 
informations a priori et multisensorielles, ainsi que de la continuité de la séquence temporelle. 
Cette intégration sera réalisée par mise à jour récursive de la densité de probabilité d'existence 
d'un objet dans chacune des cases de l'espace bidimensionnel, grâce à l'utilisation de la 
formule de Bayes. La prédiction nécessaire au filtrage utilisera un modèle d'évolution très 
simple des missiles (progression à vitesse constante vers le navire, avec du bruit additif, avec 
éventuellement plusieurs vitesses possibles si on intègre celles-ci dans l'espace des états). Les 
probabilités sont cependant dans cette simulation plus utilisées afin d'ordonner les différentes 
hypothèses et d'évaluer leurs priorités. 


B1.3 Conclusion et perspectives 


L'atelier multicapteurs, qui a commencé ses activités voici déjà quelques années, a atteint à 
présent un niveau de maturité certain, ainsi qu'en témoignent les thèses soutenues en 1988 dans 
des domaines aussi variés que les techniques bayésiennes de fusion et de contrôle, les 
architectures de machines symboliques, l'apprentissage ou l'aide à l'utilisateur, et les transferts 
réalisés soit vers le milieu industriel (micro-Kim), soit vers le milieu militaire (participation aux 
spécifications du BEMHP). L'arrivée d'un dispositif multicapteurs complexe en 89 
(PERCEPT) permettra à cet atelier d'aborder plus concrètement encore le domaine de la 
robotique par son aspect aujourd'hui le plus difficilement soluble qu'est la perception, et de 
proposer des solutions réalistes aux problèmes très actuels de réalisation d'engins autonomes. 


B.2 Activités architecture matérielle 


(Coordinateurs C.LEGRAND et T.BERNARD) 


B.2.1 Echelle "électronique" 


La question fondamentale que se pose l'atelier électronique (ainsi que l'ensemble du laboratoire) 
est la suivante : "existe-t-il une architecture optimale de perception ?" 

On ne sait pas formaliser la réponse, il faut donc expérimenter, en se laissant guider par le 
balancement algorithmes-architectures. Le souci d'une intégration efficace sera toujours présent 
: l'analogique ne sera donc pas négligée: On aimerait en outre savoir évaluer les performances 


des machines réalisées. Enfin, un effort de programmation direct en TI/TS guidera les 
recherches. | 


La méthode de l'atelier découle directement de ce qui précède. On retient la vision comme thème 
exemplaire, le mouvement algorithmes-architectures comme base méthodologique. On va câbler 
des classes d'algorithmes. Ce mouvement sera formalisé selon l'approche fonctionnelle s'il 
s'agit de graphes fixes ou peu évolutifs, par l'accumulation expérimentale de règles dont on 


tentera l'exécution automatique s'il s'agit de graphes très évolutifs dynamiquement. 


Comme il y a beaucoup d'algorithmes en traitement d'images, dont certains résistent à toute 
classification, on tentera également la démarche antagoniste partant d'architectures spécialisées. 
Il y en aura de deux sortes : si l'idée est de faire communiquer des processeurs simples et 
fondamentaux, avec une forte sémantique des communications, il s'agit de machines cellulaires. 
Si la puissance de calcul locale est plus forte et la communication purement organique, on parle 
de machines (souvent de multiprocesseurs) à forte granularité. | 
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Dans les deux cas, la contrainte d'intégration est prédominante, d'où l'importance attachée aux 
liens avec le groupe de microélectronique de l'IEF et le soin apporté à l'équipement interne en 
CAO VLSI. 
Quatre axes de recherche se sont peu à peu dégagés dans ce cadre : 

B.2.1.a L'axe conventionnel 


C'est la simulation sommaire sur ordinateur conventionnel, suivie d'une réalisation câblée, 
éventuellement optimisée matériellement par la réalisation de circuits intégrés. C'est plutôt une 


. méthode de travail empirique (d'ailleurs la seule employée par les industriels à l'heure actuelle). 


Elle atteint vite ses limites quand la complexité augmente. Elle a été mise en oeuvre pour 
l'automate PRIAM, puis (pour des raisons méthodologiques de test de limites) pour le robot 
laser. Dans ce dernier cas, dès que les besoins des utilisateurs sont devenus plus variés, on est 
revenu à une machine plus classique (moins rapide mais plus souple) développée par la société 
EIA à partir de processeurs de signal TMS 320. 


B2.1.b L'émulation 
Définissons un "émulateur" comme "un simulateur qui s'interdit de simuler ses ressources". On 
perd en généralité (ce qui n'est pas grave si, comme souvent en vision, l'application est 
structurée par le domaine) mais on gagne en puissance de calcul, de plusieurs ordres de 
grandeurs par rapport à une machine conventionnelle. 


Le laboratoire développe un émulateur pour la vision, la machine HECATE. 


Une description générale d'HECATE et de ses modules constituants à été donnée dans le 
rapport d'activité 85-86. Rappelons simplement qu'HECATE permet d'implanter des classes 
d'algorithmes. Ces classes s'expriment selon la "décomposition naturelle généralisée". Au delà 
de la constitution des modules, le problème de la communication algorithmes-architectures est 
reporté à la programmation de la machine. 

HECATE est en cours de finition. Depuis début 87, la version dite @ est opérationnelle avec 
CAPTIO, DICREM et un module de codage contours. La suite de la recherche consiste donc en 
l'amélioration de l'existant, l'incorporation progressive de nouveaux modules, l'écriture et 
l'exploitation des logiciels experts en intégration (cf.B3) [ se C2.1] 


1) Etat d'avancement des modules en chantier 


CAPTIO (opérateurs multiplexés sur des bus) constitue le module d'acquisition et de 
prétraitement d'HECATE. 


Il est subdivisé en trois modules : le module 1 chargé de l'acquisition et de la numérisation 
proprement dite : une carte, le module 2 de prétraitements : trois cartes et le module 3 dit de 
fenêtrage : une carte, soit cinq cartes au total. 

Le module 1, capable de digitaliser 2 voies vidéo analogiques et d'interfacer 2 voies numériques 
supplémentaires, dispose de quatre tables de transcodage ( look-up }), de deux commandes de 
gain analogique manuelles ou automatiques, d'un synthétiseur de fréquence pixel pilotable par 
synchronisation ligne et d'un multiplexeur de visualisation couplé a un convertisseur digital- 
analogique de pré-controle de l'acquisition. 


Le module 2 de prétraitement est organisé autour d'opérateurs câblés multiplexés dans un 
réseau dit "semi-figé" : les accès a certains opérateurs sont préhemptifs sur d'autres opérateurs, 
mais l'ensemble permet de concevoir des traitements parallèles séparés. En fait CAPTIO est 
capable de gérer de manière totalement séparée 2 voies images et leurs signaux de 


synchronisation. Les opérateurs sont : 
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.pour la carte 1 : OVR8 : 32 tables de transcodage à accès rapide groupées en 4 flots 
images et AD4 additionneur câblé de 2 a 4 flots d'images 


.pour la carte 2 : ADN est un additionneur 1 voie image + 1 voie mémoire, couplé a un 
mécanisme qui permet le calcul par exemple de la moyenne de N images successives. OVL est 
un tableau de 128 tables de transcodage sélectionnables par comptage de lignes dans l'image ; 
son utilisation concerne par exemple la correction d'offset de capteurs lignes (ex: Images 
satellites) et OV16, table de transcodage 16 bits en 8 bits de précision couplé a un sélecteur de 
dynamique. Ces trois opérateurs sont découplés matériellement. Seuls leurs accès par des bus 
internes a la carte sont limitatifs quant aux possibilités de configuration. 


Ja carte 3, dernière carte du module 2, intègre un comparateur de deux images câblé et 
trois multiplexeurs d'accès a tous les canaux images du module 2 en vue de leur conversion 
digitale analogique pour écran couleur ( fausses couleurs R G B). 


Le module 3 qui tient en une carte gère quant à lui deux fenêtres câblées totalement 
programmables instantanément. 

L'ensemble occupe 1/2 M3 dans un rack quadruple Europe super-étendu et est interfacé aux 
autres modules par câbles en nappes, paires torsadées ou fibres optiques. Sa commande réside 
sur un processeur 68000 de la machine Chorix ( SIM 90 de TRT + système réparti temps réel 
Chorus ). 


L'évolution matérielle résulte de l'avancée technologique dans le domaine des composants 
vidéo specialisés et l'évolution logicielle, dans la maitrise de plus en plus grande des outils 
informatiques utilisés dans la gestion du système "HECATE" : système Chorus, UNIX etc. 


Citons pour le matériel : la remise en forme de la partie synthèse de fréquence (VCO) et 
extraction de signaux de synchronisation de l'ensemble conversion analogique numérique, et 
l'interfaçage direct de CAPTIO avec des capteurs video numériques très évolués. (exemple : 
SUPER-CAM de la société E.I.A), ou le retour et la visualisation, sur ce module, d'images 
numériques résultats des traitements d'autre modules d'HECATE. 


Pour l'ensemble de conversion analogique-numérique, le gain réside dans l'augmentation de 
performances et de souplesse de conversion des signaux video analogiques issus de divers 
capteurs du marché. | 

L'entrée numérique enfin, renforce le concept déjà intégré dès le début de l'étude de CAPTIO, 
d'un module ouvert simultanément a une large gamme de capteurs vidéo. 


L'évolution logicielle, quant à elle, réside surtout dans la clarification des accès de la 
commande du module, par le biais d'un acteur CHORUS, encapsulant totalement le module 
matériel, et par la validation du pilotage direct de CAPTIO par un language de haut niveau de 
type LISP. | 

Cette dernière avancée donne une vision synthétique et claire du module dans l'environnement 
de programmation d'HECATE tant au niveau commande qu'au niveau du diagnostic de 
fonctionnement de la machine toute entière. 


COLISE [ 3 C2.2]constitue l'assembleur cablé spécialisé dans l'extraction des régions et 
contours. 


Ce module était déjà décrit dans le précédent rapport de recherches 85-86. 87 a vu la poursuite 
des développements tant matériels que logiciels. | 

Ceci s'est concrétisé pour le matériel par la réalisation de nouveaux opérateurs trieur ,opérateur 
arithmétique et logique parallèle qui offrent la possibilité d'implanter une classe plus large 
d'algorithmes. Paralèllement ont été dupliqués les opérateurs MSFL et Convolueur Généralisé 
qui permettent de mettre en œuvre les multiples possibilités de parallélisme bas niveaux de 
COLISE. | ; | 

Dans la bibliothèque des opérateurs globaux les opérateurs histogrammeurs et étiqueteurs sont 
respectivement en cours de mise au point et en fabrication. Il devraient être opérationnels tous 
deux en 89. Rappelons que le rôle principal de’ces deux opérateurs est le contrôle et la 
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terminaison des algorithmes de segmentation. Ceci donnera à COLISE une homogénéité 
suffisante en vitesse d'exécution des différents traitements pour aborder de manière réaliste des 
applications temps réel. 


L'exploitation des travaux précédents en détection des contours et leur introduction dans 
COLISE est en cours. 


Les développements logiciels ont consisté en l'élaboration progressive de l'assembleur qui 
exploite les opérateurs câblés. Initialement élaboré sous le système UNIX pour des questions 
de facilités de développement, il est actuellement en cours d'intégration sous CHORUS en vue 
d'activer les primitives temps réel. | 


MORPHEE est le nom de la mémoire partageable et du réseau d'échanges dans la machine 
HECATE. 


La construction de MORPHEE 2 été précédée de la réalisation probatoire d'une mémoire plus 
simple, dite NYX, destinée à tester les principes généraux, architecturaux et technologiques. 


NŸYX est actuellement en fin de test, dans le cadre d'une "expérimentation" reliant CAPTIO, à 
COLISE. 


MORPHEE réalise le séquencement des opérations entre les diverses fonctions et ce par dessus 
le découpage en modules. 


Le module se présente sous la forme d'un rack incluant les divers sous-modules (Bancs 
Mémoire Physique, Bancs Mémoire Logique en entrée, Bancs Mémoire Logique en sortie, 
générateur d'adresses et réseau d'interconnexion). 


La quantité accrue de communications inter-cartes (due au multi-accès) a nécessité l'utilisation 
d'un système de multiplexage des données sur les fonds de paniers, réalisé en technologie ECL. 
Les horloges, sont générées au moyen d'un sous-module spécifique utilisant des composants 
ASGA. Les liaisons entre MORPHEE et les opérateurs de traitement d'image mettent en oeuvre 
des fibres optiques. 


La conception des bancs mémoire physique est actuellement achevée, les bancs mémoire 
logique, le générateur d'adresses et le réseau d'interconnexion sont en cours de réalisation, 
l'achèvement du module étant prévu pour fin 1989.[ 63 C2.3] 


MEDCIN est le moins avancé des modules d'HECATE. Il est déduit du module DICREM 
(voir rapport 85/86) déjà opérationnel. MEDCIN a pour fonction dans HECATE l'exécution des 
algorithmes de décision basés sur les parcours d'arbres. Architecturalement, c'est un 
multiprocesseur de type MIMD/SPMD (cf B2.1.c). Une version à quatre processeurs sera 
incorporée dans HECATE. 63 C2.4, C2.5] 


2) Liaisons optiques dans HECATE [ 6 C2.7] 


Dans une machine modulaire de grande taille, les distances séparant les diverses parties 
constituantes peuvent finir par poser problème: rayonnements, couplages parasites par la masse, 
pertes en ligne... Pour pallier cette difficulté, ont été développées des communications par 
fibres optiques présentant les avantages suivants: large bande passante, immunité aux bruits 
rayonnés, isolement galvanique, faibles pertes. | 

Les fibres utilisées sont des fibres multimodes 50-125: l'émetteur optique est constitué d'une 
diode GaAI As à 820 nm, le récepteur d'une photodiode PIN et d'un amplificateur faible bruit. 


Les pertes d'insertion sur la fibre sont comprises entre 2 et 4 dB/km: les longueurs de fibres 
étant de 25m, l'atténuation est très faible. 
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Le premier montage utilisé permettait la transmission de signaux dont les rapports cycliques 
avoisinaient les 50%. Pour élargir le champ d'application, un codage Manchester de 
l'information a été utilisé. Aïnsi est née la première liaison CAPTIO-NYX. Cette solution, bien 
qu'imparfaite , a néanmoins permis un dialogue correct entre les deux modules. 

Ayant épuisé toutes les ressources du codage, nous sommes revenus sur le montage de base et 
l'avons amélioré de telle sorte qu'il puisse transmettre des signaux de rapport cyclique 
quelconque à une fréquence maximum avoisinant les 100 Mhz, dans une technologie TTL. 

La prochaine étape consistera à multiplexer les signaux par 4 voire par 8 aux limites de la 
technologie TTL puis d'essayer pour la partie électronique, un prototype en Arsénium de 
Gallium permettant d'accéder à un haut niveau de multiplexage. 


3) Extensions de Captio [ 6e C2.6] 


La motivation de ces extensions était de fournir dès l'acquisition/préparation d'image des 
traitements élémentaires délivrant des références (histogramme pour seuillage, Laplacien pour 
seuillage adaptatif, etc….). 

Nous en avons donc prévu deux, incluant pour des raisons de compacité autant que de 
certitude, nos cicuits intégrés “maison”: 

1/ Celle basée sur les premières générations de prédiffusés développées au laboratoire (MSEL et 
CG. Voir rapports d'activité précédents). Elles ont donné lieu à la réalisation de cartes de 
convolution généralisées. 

2/ Les "courbes" basées sur le composant prédiffusé/précaractérisé 5000 portes 2 couches métal 
développé en collaboration avec MHS (voir rapport d'activité 1985/1986). Elle permet le calcul 
à la volée des projections et des histogrammes. 

Les courbes, supports d'informations de types variés, sont d'utilisation fréquente en traitement 
d'images. C'est la raison pour laquelle le circuit "courbes", composant étudié spécialement pour 
le déroulement, en temps réel, d'algorithmes d'extraction et de traitement de courbes élaborées à 
partir d'une image, a été conçu à l'ETCA. 

Les 2 fonctions de ce circuit sont : 


* l'élaboration de courbes : | 
- des histogrammes calculés sur toute ou partie de l'image 
- des projections réalisées sur différents domaines de l'image 
(sur toutes les lignes ou toutes les colonnes ). 
* l'analyse de ces courbes : 
- la recherche des valeurs extrêmes de la courbe 
- le tri associatif par valeurs croissantes de la courbe... 
Une plate-forme a donc été conçue pour supporter différentes applications, autorisant le temps 
réel et permettant de manière recurrente la multiplication des circuits de base. Cette plate-forme 
comporte deux parties distinctes. 


* une partie commune à toutes les applications comprenant : 


- une interface avec le bus VME supportant le logiciel de contrôle de la carte 

- un bloc d'interface avec la source d'image (dans notre cas, le module 
d'acquisition CAPTIO) 

- deux générateurs d'adresses 

- deux mémoires d'images pour le stockage des images à traiter 

- deux mémoires tampons pour le stockage final des courbes élaborées par le 
circuit 

- un traceur des courbes sur écran 

- un aiguilleur de signaux pour la composition de l'écran d'affichage (permettant 
la visualisation des courbes à l'écran en simultanéïté avec celle des images 
traitées) | 
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* une partie spécifique à chaque application, constituée d'un ou plusieurs processeurs 
"courbes" et des séquenceurs associés indispensables pour le déroulement des algorithmes et 
pour le contrôle des circuits 


L'élaboration d'histogrammes et de projections, en temps réel à partir d'une image 512x512, 
nécessite l'utilisation d'au moins six circuits "courbes". 


Après quelques essais d'histogramme sur image réduite, nous avons choisi de figer dans un 
premier temps les projections horizontale et verticale sur image 512 x 512 à la volée qui mettent 
en oeuvre un séquenceur ainsi que des chemins de données internes totalement différents de 
ceux testés précédemment. | 
En effet, dans ce cas, les six circuits travaillent par trois : leurs ALUSs sont cascadées pour 
donner deux ALUSs de 24 bits.Les trois premiers traitent les 256 premières lignes ou colonnes 
de l'image, selon qu'il s'agit d'une projection horizontale ou verticale, et les trois autres traitent 
les 256 suivantes. Le traitement consiste à faire la somme des valeurs sur 8 bits des 512 pixels 
de chaque ligne ou colonne. Aïnsi, la présence d'un objet sur l'image se traduit sur les courbes 
calculées, par une déformation positive ou négative, selon que l'objet est plus clair ou plus 
sombre que le fond. 


Le calcul du minimum sur ces courbes, permet de transmettre, au module CAPTIO), les adresses 
de la ligne et de la colonne la plus sombre de l'image, de centrer et asservir une fenêtre de taille 
déterminée sur ces coordonnées, et d'obtenir dans le cas d'un mobile se déplaçant sur un fond 
globalement différent, un suivi de cibles temps réel. 


Pour cette application, le séquenceur externe, bien que beaucoup plus complexe que dans les 
cas précédents, a été défini par la même méthode : | 


- écriture en “assembleur circuit courbe" des algorithmes 


- conversion de cet assemblage en tableaux de fonctions booléennes 
* table de transitions 
* table de commandes 


- compilation de ces tableaux sous forme de PLA 


Pour conclure sur l'état d'avancement et les perspectives d'avenir d'HECATE, on peut dire que 
cette machine, quasi complètement réalisée fin 89 verra alors s'accentuer sur le plan recherche 
sa fonction fondamentale de support d'études de conception d'automates de vision. En même 
temps, sera cristallisée sa fonction annexe, mais importante, de machine générale de traitement 
d'images à la volée au service du laboratoire. Dans cet esprit, HECATE est d'ores et déjà 
utilisée comme machine de numérisation et de prétraitement d'images mises à disposition de 
l'ensemble des chercheurs. | 


B.2.1.c Les architectures spécifiques 
Dans le cas des architectures spécifiques, le mouvement algorithmes-architectures est simplifié, 


du fait que l'architecture est connue a priori, ou peu évolutive. 
Deux classes d'architectures sont expérimentées. 
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Résultat écran de projections horizontales 
et verticales en temps réel sur une image 
de deux chars 


On distingue nettement les deux canons en projection horizontale et les deux chars en projection verticale ce qui 
permettrait de caler une fenêtre de poursuite tant que le fond est globalement différent des formes traquées 














1/ machines à faible granularité 


La puissance de calcul locale est faible, l'interconnexion a une sémantique forte. On a affaire à 
des machines dites "cellulaires". L'intégration est simplifiée du fait qu'il s'agit de motifs 
répétitifs relativement simples, favorables à la réalisation de VLSI. (Reste le problème des 
connexions entre ces motifs, qui demeure un problème de recherche extrêmement ouvert). 
Plusieurs machines cellulaires sont en cours de réalisation, en collaboration avec l'IEF 
(pyramide, rétines, voir B2-2). 


2/ machines à fortes granularité 


Dans ce cas, la puissance de calcul locale est forte ou très forte. La sémantique de 
l'interconnexion est nulle. Pratiquement, ces machines sont toujours des "multiprocesseurs de 
signal”. On profite alors de l'intégration par les industriels du produit scalaire dans des 
machines séquentielles, possédant éventuellement divers aménagements pour augmenter la 
puissance de calcul (multi bus intégrés) et pour faciliter l'usage en multiprocesseurs. Le 
laboratoire doit spécifier et parfois intégrer la "glue" et certaines zones spécialisées. 


En 87, une évaluation a été faite d'un multi transputer sous langage OCCAM. 


Un banc d'essai multiprocesseur MIMD/SPMD (MEDCIN) [ 6 C2.4lest en cours de 
développement, dans le cadre d'un projet plus général, dit MEAP. 


Le projet MEAP (Machine d'Exploitation d'Algorithmes Parallèles) a deux motivations : 


1/ Les projets de module de décision MIMD dans HECATE 
supportant les techniques de parcours d'arbre (module MEDCIN) 


ü/ Les projets de promotion du calcul parallélisé dans la communauté 
de physique, par le biais du concept SPMD dérivé de la machine OPSILA 
du LASSI.[ 63 C2.5] 


Rappelons également que la machine de recherche en traitement d'images HECATE a donné 
lieu à des transferts directs. Dans ce cadre, la société EIA est à l'origine d'une lignée de 
machines de traitement d'images, commercialisée au niveau européen. La dernière version de 
ces machines, SUPERCAM, pourrait d'ailleurs très facilement être transposée à des 
applications opérationnelles en poursuite de cibles. 


Les connaissances et compétences ainsi acquises par la société EIA et la similarité technique des 
deux projets ont permis d'envisager de réaliser dans le cadre de MEAP, une version industrielle 


de machine dont les constituants puissent servir en même temps de support à l'expérimentation 
sur MEDCIN. | 


La version industrielle est de type SPMD. Elle utilise comme base d'une architecture à au moins 
16 processeurs un puissant processeur de signal. Une étude approfondie des composants 
existant sur le marché est en cours. 


L'utilisation des produits industriels pour la recherche en architecture se fait de la façon 
suivante: 


* Un banc d'essai multiprocesseur MIMD/SPMD est monté à l'ETCA. Le champ d'application 
initial sera l'algorithmie de perception multicapteur, avec au début un fort accent sur la mise en 
oeuvre des techniques de décision en vision. Suivra, sous réserve de développements logiciels 
adéquats, le contrôle en temps réel de processus répartis. 


Des langages et des environnements de programmation parallèles de type multi-tâches devraient 
également être étudiés, pour un accroissement significatif des performances à l'exécution, des 
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notions de processeur, virtuels étant mises en oeuvre pour une simplification de la 
programmation. | 


* En ce qui concerne l'algorithmie de perception, la complexité des problèmes à traiter 
(parallélisation et mise en oeuvre simultanée et concurrente d'algorithmes) exige un noyau de 
machine comportant des parties d'ores et déjà bien connues, d'autres à découvrir, aussi bien en 
architecture matérielle que logicielle. 


La partie connue a priori sera construite à partir d'éléments de base industriels fournis par EIA, 
qui les dérivera de son prototype de machine SPMD. Les sous-ensembles nécessaires à la 
recherche seront ajoutés sous la forme d'extensions développées à l'ETCA (contrôle de réseau, 
primitives d'accès câblées.…). 


De cette façon, tout en profitant des résultats de l'industrialisation, on ne devrait pas la remettre 
en cause. 


En résumé, la présente opération concerne la conception et la réalisation, en partenariat 
ETCA/EITA, sous parrainage DRET/SDR, de deux versions d'un prototype. L'une, implantée à 
ETA, servira de tête de série des machines industrielles. L'autre, implantée à l'ETCA et assortie 
d'extensions issues de la recherche, servira de support à la réalisation de MEDCIN et plus 
généralement l'étude de mécanismes MIMD. | 


Plus précisément, les axes de recherche se répartissent en deux groupes : la recherche sur le 
contrôle de la machine, la recherche sur la parallélisation d'algorithmes de haut 
niveau. 


Pour le contrôle de la machine, on étudiera la programmation par processeurs virtuels 
implantés sur les processeurs physiques élémentaires. Avec cette méthode, le programmeur 
n'est pas limité dans le nombre de machines virtuelles communiquantes en lesquelles il peut 
décomposer son application . D'autres part, il est débarrassé de la gestion explicite des 
communications, indispensable dans la programmation par tâches. Enfin, les programmes 
restent indépendants des évolutions successives du nombre de processeurs physiques dans la 
machine. 


La programmation en mode MIMD implique un ARBITRE DE RESEAU pour la gestion des 
conflits de communication. En effet, l'utilisation d'un réseau entièrement connecté n'empêche 
pas les conflits quand plusieurs processeurs différents tentent d'accéder à un même processeur 
(situé sur un processeur physique différent). L'arbitre de réseau implique une recherche 
architecturale pour découvrir la structure la mieux adaptée à la réduction du goulot 
d'étranglement dans la gestion des échanges. [ C'est ce goulot d'étranglement qui amène les 
phénomènes de saturation dans les multiprocesseurs]. 


Pour la parallélisation d'algorithmes de haut niveau certains algorithmes de traitement 
d'images seront programmés en SPMD. En MIMD seront programmés des algorithmes de 
décision , appliqués à la reconnaissance de forme ou au contrôle d'action. 


Cette recherche algorithmique a des conséquences architecturales ; certaines zones vitales de 
l'architecture, découvertes lors de la décomposition des algorithmes, seront optimisées 
matériellement. L'une de ces zones a pu être déterminée a priori : il s'agit du Processeur de 
Gestion Mémoire (PGM) spécialisé dans l'exploitation "intelligente" des messages circulant sur 
le réseau. 


Comme exemple d'opérations optimisées par le PGM, citons le cas ou les données incluses 
dans les messages sont des luminances de pixels ou des régions étiquetées. Le PGM optimise 


l'application à ces données de traitements particuliers, par exemple recherche de min/max, 
classification, etc. 





B.2.1.d Le calculateur fonctionnel 


C'est une voie intermédiaire entre HECATE et les architectures spécifiques. On s'inspire de 
BACKUS pour établir un "langage fonctionnel" valable à la fois pour la description des graphes 
de traitement d'images et celle des graphes d'opérateurs d'une bibliothèque silicium les réalisant 
matériellement. La composante microélectronique étant prédominante, nous le décrivons en B2- 
ne 


B2.2 Echelle "micro-électronique" 


B2.2.a Naissance d'un noyau micro-élecronique 


Outre les considérations d'ordre scientifique, le point marquant de la période 1987/88 est 
incontestablement l'acquisition par l'équipe microélectronique d'une identité propre. 

La situation antérieure était caractérisée par un déport extérieur systématique des travaux 
d'implantation VLSI (Very Large Scale Integration), soit par envoi d'ingénieurs dans un centre 
de conception du fondeur retenu (Circuit Courbe implanté chez MHS) soit au travers de 
collaboration avec d'autres organismes de recherche, principalement l'Institut d'Electronique 
Fondamentale à l'Université Paris XI (Circuit Pyramidal et Rétine). 

La période 1987/88 aura vu la constitution d'une équipe microélectronique stable et formée aux 
techniques d'intégration dites "Full Custom" (dessin au micron). Ceci explique d'ailleurs 
partiellement l'orientation actuelle des projets dans cette direction ou vers des réalisations de 
type précaractérisé avec intervention au niveau du placement-routage, par opposition aux 
circuits antérieurs de type prédiffusé. 

Corrélativement, le renforcement en personnel s'est accompagné d'un effort en équipement tant 
matériel que logiciel. A l'aube de 1989, le laboratoire disposera de deux stations de travail 
puissantes spécifiquement destinées à la conception VLSI, d'une chaine "Full Custom" 
d'origine universitaire (collaborations avec l'IEF et l'ENSTA), et d'une chaine de CAO 
industrielle de type "Standard Cell”. La présence conjointe de moyens et de compétences 
consacre la naissance d'un "noyau microélectronique" au sein du laboratoire. Comme 
conséquence pratique, le circuit du Calculateur Fonctionnel va être conçu et dessiné "in situ", 
condition indispensable à l'élaboration d'une compétence collective et donc transmissible. 
D'autre part, la collaboration avec l'Institut d'Electronique Fondamentale voit son équilibre se 
déplacer du partage préexistant algorithmie-intégration vers une activité accrue de conseil dans 
les domaine architecture et conception VLSI, concernant notamment des opérativités à caractère 
“exotique” (analogique, optoelectronique, optique). 


B2.2.b La voie fonctionnelle. 
L'activité microélectronique n'en reste pas moins au service de la Perception et, à ce titre, liée 
étroitement aux activités matérielles et logicielles. La voie fonctionnelle en est un exemple 
éloquent. | | 
Un algorithme de traitement du signal ou de traitement d'image de bas niveau peut généralement 
être présenté comme un enchainement spécifique, non nécessairement séquentiel, d'opérations 
modulaires et paramétrables. Ceci suggère l'identification de fonctionnalités élémentaires de 
traitement d'image, et leur intégration sous la forme de circuits tranchables (associables pour 
une augmentation de dynamique) et cascadables (associables pour un aggrandissement de 
voisinage de traitement, ou un enchainement d'opérateurs). Vu sous un angle 
microélectronique, une telle démarche correspond à la création d'une bibliothèque de cellules 
précaractérisées de granularité moyenne, spécifiques du domaine du traitement d'image. 
Dans ce contexte, les années 1984/86 avaient vu l'intégration et l'utilisation au sein 
d'applications, des circuits Mise sous Forme Locale (Traitements d'adresse pixels pour la 
constitution de masques bornés exploitables à la volée) et Convolueur Généralisé (Produit 
intérieur d'opérations élémentaires arithmétiques ou logiques sur des données réorganisées à 
l'aide du circuit précédent). | 
Cette phase s'est poursuivi durant la période 1987/88 avec deux autres circuits : 
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- Courbe : | 
Extraction et manipulation de paramètres globaux d'image de type liste. 
Précaractérisé/prédiffusé de 5000 portes fondu chez MHS dans une technologie CMOS 21m 2 
métaux. 
Les fonctionnalités du circuit courbe (calcul d'histogramme, projection) ont été testées 
progressivement au moyen de maquettes de complexité croissante, interfacées au module 
d'acquisition CAPTIO, et ont permis la validation complète du composant. On citera 
particulièrement l'élaboration de projections temps réel sur image 512x512, débouchant sur une 
application de type poursuite de cible. (cf. B.2.1.b) 

- Crossbar/Tri Associatif : 
Aiguillage de données de type crossbar 16x16, reconfigurable au vol, avec possibilité de 
redirections associatives quelconques (accès aux données par leur propriétés). Circuit "Full 
Custom” de 10.000 transistors conçu à l'université de Yale (Connecticut/Etats-Unis) et fondu 
par MOSIS (CMP américain) dans une technologie CMOS 3um 2 métaux. | 
Malgré les risques de l'intégration "Full Custom” qui se prive de la caractérisation analogique 
approfondie d'une bibliothèque de cellules proposées par le fondeur, le circuit a donné toute 
satisfaction au cours des tests, aboutissant à la validation du concept de base. Cependant, pour 
des raisons de propriété, les composants n'ont pu être intégrés de façon permanente au sein 
d'un module. Aujourd'hui une telle éventualité ne se reproduirait plus, le laboratoire étant 
désormais rodé pour mener à bien de tels projets en interne. 


D'une certaine manière, ce dernier circuit achève une phase où les interactions entre algorithmie, 
architecture, et intégration VLSI auront été éprouvées au coup par coup sur des fonctionnalités 
de base de traitement d'image, dont l'identification reste indissociable de l'élaboration même de 
l'émulateur HECATE. L'intégration des quatre circuits précités a été riche d'enseignements et 
fournit au laboratoire une maturité suffisante pour aborder des projets de complexité 
supérieure. 


B2.2.c Expertise VLSI 


L'exploitation de l'émulateur HECATE vers l'intégration VLSI rentre dans ce contexte. En 
effet, la production d'automates fils par la machine HECATE fournit essentiellement un résultat 
d'existence d'une solution cablée correspondant à un algorithme donné, maïs ne prend pas en 
compte les contraintes d'intégration VLSI. Pour ces raisons, le laboratoire a entrepris une 
optimisation automatique d'architecture VLSI à partir du graphe de.contrôle de flot de données 
de l'algorithme émulé et de la description matérielle de la machine émulateur. "L'espace de 
conception" est exploré par une méthode de recuit simulé. Les transformations élémentaires 
conservent la sémantique intrinsèque du graphe. Les contraintes technologiques sont introduites 
dans les fonctions de coût utilisées. L'approche se limite pour l'instant à des contraintes 
temporelles et surfaciques globales pour une technologie donnée. Les performances atteintes 
sont meilleures que celles des algorithmes les plus récents concernant les problèmes 
d'ordonnancement de graphes sous contraintes. La complexité est en o(n) contre o(n2) pour les 
“Nc ui dé “force directed scheduling" (Bell-Northern Research Lab à Ottawa Canada).[ & 
8] | | | 
Ce projet, dont le développement a été mené à un haut niveau synthétique, va être validé sur des 
exemples réels d'intégration. En effet, la chaine "Full Custom" dont dispose le laboratoire a été 
complétée par le développement récent d'un compilateur de silicium à un niveau structurel. 
Destiné initialement à pallier l'absence cruciale d'une saisie de schémas permettant des 
simulations avant le dessin du "layout", le système développé dépasse largement ses ambitions 
premières. Les spécifications structurelles sont introduites de façon textuelle au moyen d'une 
extension du langage de description de "hardware" Model (Université d'Edinburgh). La voie 
textuelle permet un interfaçage aisé avec tout simulateur. La description structurelle une fois 
vérifiée, le compilateur fournit en un temps minime une version localement routée assemblant 
cellules paramétrées et macroblocs issus de générateurs externes. En particulier, ce logiciel est 


Et en aval du procédé d'optimisation d'architecture VLSI mentionné précédemment.[ 6 
2.7] 
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B2.2.d Calculateur Fonctionnel, 


Le calculateur fonctionnel est également une suite logique aux travaux menés au laboratoire sur 
la démarche fonctionnelle, aussi bien sur le plan matériel que logiciel. Il s'agit d'une machine à 
flots de données constituée d'un réseau matriciel de processeurs élémentaires intégrés. Un 
algorithme de traitement d'images de bas niveau décrit sous une forme fonctionnelle peut être 
transcrit sous forme de graphe d'opérateurs. Un tel graphe peut alors être implanté directement 
sur le réseau de processeurs. Chaque processeur est utilisé soit pour aiguiller les flots de 
données, soit pour effectuer une opération élémentaire sur ceux-ci. En associant un ou plusieurs 
de ces processeurs, il est possible d'effectuer en particulier toutes les opérations implantées sur 
les circuits précédemment développés au laboratoire (MSFL, CG, Courbe et Crossbar). 
L'intérêt de cette approche est de réunir simultanément la puissance, la régularité, la généralité et 
la simplicité. 





/n : mot de n bits de dynamique S: fonction de partage de la dynamique 
(1 entrée sur 8 bits, 2 sorties sur 4 bits° 
X: fonction multiplication +: fonction addition 


C: fonction de concaténation (2 entrées sur 4 bits, 1 sortie sur 8 bits) 
m: bits de poids fort 
L: bits de poids faible 


Accroissement de la dynamique de la multiplication par association de P.E. 


Actuellement des simulations intensives d'algorithmes ont été effectuées sur un simulateur 
logiciel du calculateur. Ces simulations ont permis de déterminer la granularité optimale 
(compromis entre les capacités de communication et traitement et l'encombrement). Un schéma 
assez définitif du circuit processeur éléméntaire et de la machine a été développé. Nous avons 
retenu un circuit biprocesseur et une machine avec un réseau de processeurs tridimensionnel de 
taille 8 x 8 x 16. Nous avons également effectué une évaluation des différents fondeurs 
potentiels et nous sommes prêts à démarrer la phase d'intégration du circuit. Le processeur 
élémentaire sera constitué de 6 ports d'entrées-sorties, 3 piles d'entrée, 3 piles de sortie et un 
chemin de données comprenant 1 multiplieur, 1 unité arithmétique et logique, 1 opérateur valeur 
absolue et trois barrel-shifters. Il contiendra également une mémoire de données de 256 mots 
de 9 bits et une mémoire de programme de 64 mots de 28 bits. Le circuit biprocesseur intégrera 
environ 160.000 transistors.[ ss C2.10] 


B.2.2.e SPHINX : une Architecture Cellulaire Pyramidale: 


Par opposition à la démarche fonctionnelle, présente ou sous-jacente dans les thèmes abordés 
ci-dessus, le compromis algorithmie-architecture dépend ici d'une contrainte initiale 
architecturale forte, qui peut concerner l'adhésion à une certaine régularité de communication 
des données entre processeurs et/ou l'adéquation à une contrainte plus physique (VLSI 
notamment). Pour Sphinx, le mode de communication pyramidal est déterminant. 
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Circuit de test pour un dispositif thermologique 


Dans le biprocesseur fonctionnel il vérifie que les paramètres de fonctionnement restent dans les limites correctes 
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Circuit constituant de SPHINX 


(les 4 mémoires sont visibles associées à la "mer" de 16 PE.) 








De nombreuses applications rencontrées en Traitement d'Image s'apparentent à des requêtes 
associatives sur l'image traitée (accès aux données par les propriétés). Les travaux de recherche 
initiaux, menés en coopération avec l'Institut d'Electronique Fondamentale, avaient montré que, 
dans le contexte Traitement d'Image, la réalisation d'une mémoire associative est efficacement 
remplacée, à potentialités égales, par celle d'une machine cellulaire pyramidale. Cette pyramide 
est constituée d'étages horizontaux empilés, au sein desquels chaque processeur est relié à ses 
quatre voisins Nord, Sud, Est, Ouest. Le passage d'un étage aux étages supérieur ou inférieur 
se fait suivant des connexions du type “un père-deux fils", dont la polarisation change entre 
chaque étage. Le problème complexe du contrôle, SIMD par étages et MIMD entre étages, est 
rattaché aux activités logicielles. 





Pyramide 4 x 4. 


Les premières tentatives d'intégration "Full Custom" du processeur pyramidal ont démontré 
leur limites au niveau de la fiabilité de conception. En effet, malgré sa structure monobit, le 
processeur pyramidal est relativement complexe et irrégulier. Aussi, une solution plus 
conservatrice a été adoptée, faisant appel aux bibliothèques et compilateurs spécialisés d'un 
fondeur (VLSI Technology France) dans un environnement de conception de type 
précaractérisé, afin de privilégier les aspects de sécurité, de fiabilité et de temps de conception. 
En revanche, l'éventail des fonctionnalités disponibles chez le fondeur ont contraint la structure 
interne retenue initialement pour le processeur élémentaire. 

Finalement, la phase d'intégration, mené à l'Institut d'Electronique Fondamentale, a abouti à 
un circuit d'environ 100.000 transistors comportant 16 processeurs élémentaires (4x4) accédant 
chacun sériellement à 256 bits de mémoire (1 banc mémoire se partage par mots de 4 bits entre 4 
P.E.). Parmi les modifications essentielles apportées, le registre d'inhibition est implanté 
algorithmiquement, les instructions sont codées sur 2x15 bits, des facilités de pointage local 
sont disponibles, l'unité arithmétique et logique posséde un jeu d'instructions très riche pour 
compenser les contraintes d'accès aux bancs mémoire. | 

La première phase de test a été satisfaisante. Les deux laboratoires préparent désormais un 
banc d'essai.pour l'assemblage et l'évaluation algorithmique d'une pyramide de base 32x32 
associée à un contrôleur cellulaire. 


B2.2.f RETINE : du Cellulaire au Neuronal. 





Le projet de rétine est fondé sur un double principe d'unification traitement-objet et de précocité 
de là perception. Aïnsi la rétine repose sur un seul type de données, le plan de bits (image 
 binaïre), et sur une famille unique et complète d'opérateurs, les Traitements Combinatoires 
Locaux (fonctions logiques invariantes par translation) mis en oeuvre sur un tableau SIMD 
bidimensionnel et organisé en 4-connexité. L'intégration sur circuit monolithique combinant en 


50 


SO RS SR SL 


chaque site, un capteur optoélectronique (photodiode), un procédé de binarisation (B-codage), 
et la mise en oeuvre de l'algorithmie TCL par un processeur minimal, permet d'élaborer une 
vision autonome précoce, aux sens temporel et algorithmique. 





Zoom sur un processeur rétinien. 


Les efforts entamés durant la période précédente concernant les aspects matériel, logiciel et 
algorithmique, se sont poursuivis et concrétisés par les soutenances respectives de deux thèses. 
Au niveau matériel, une exploration systématique de procédés de B-codage simples et compacts 
en technologie CMOS a retenu comme solution fiable optimale une variation locale des seuils 
(Bayer) contrôlée par quelques horloges extérieures. Un procédé à inhibition latérale a 
également été étudié. Enfin, une rétine de taille 60 x 60 a été intégrée; elle est actuellement en 
cours de test et donne des résultats partiellement satisfaisants. Ces travaux d'intégration ont été 
réalisés à l'Institut d'Electronique Fondamentale. 

Au niveau logiciel, l'écriture du simulateur "Rétina" (généré grâce au compilateur Yacc d'Unix) 
a permis de supporter le développement algorithmique rétinien. 

Au niveau algorithmique, les premières études se sont concentrées sur le traitement d'images 
seuillées, plus simple à aborder. Notamment, une méthode de discrimination de formes 
géométriques a été mise au point, utilisant une décomposition en deux facteurs du traitement 
rétinien, et expérimentée en poursuite de cible. Ensuite, les traitements se sont étendus sur 
images multiniveaux. L'aptitude des TCL à extraire les niveaux de gris ou même des textures a 
été démontrée, permettant l'extension plus ou moins commode de l'algorithmie binaire 
développée antérieurement. Enfin, des techniques de représentation synthétique de résultats de 
traitements (projection, comptage) ont été implantées par des TCL élémentaires. 

Outre la consolidation, évoquée ci-dessus, de thèmes de recherche définis antérieurement, le 
projet Rétine a suscité l'utilisation novatrice de techniques dites neuronales. Le but initial était de 
permettre une collaboration analogique entre pixels appartenant à un même voisinage pour que 
l'image binaire B-codée rende au mieux l'information lumineuse reçue. Le procédé mis au point 
minimise une distance quadratique entre l'image multiniveau acquise par les photodiodes, et 
l'image binaire résultante convolée par un noyau variable. Le nombre de niveaux de gris est 
théoriquement illimité et réglable en temps réel. D'autre part, l'existence d'un formalisme sous- 
Jjacent permet de mieux appréhender les aspects vision, et optimisation du couple B-code - TCL. 
Par ailleurs, des études plus en amont ont permis de cerner le compromis “Parallélisme-Non 
linéarité”" dans un cadre plus général de binarisation. Enfin l'écriture d'un simulateur et 
l'intégration de cellules de test démontrent que, moyennant un coût d'intégration additionnel 
modique, le procédé de B-codage neuronal conduit à un excellent compromis entre la fidélité en 
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niveau de gris et la résolution spatiale. Au total, 4 circuits "Full custom ont été intégrés, dont 
une matrice de test de taille 16x16. Cette étude doit être considérée comme un premier pas vers 
un compromis entre traitement analogique et traitement TCL des images, acquises par le 
calculateur rétinien.[ 63 C2.11] 





B2.3 Conclusion et perspectives 


Le futur des composantes électronique et microélectronique de cet atelier dont les activités sont 
étroitement complémentaires et donc indissociables, laisse clairement entrevoir trois tendances 
motrices : 


- Après une période de quelques années surtout consacrée à la construction du support 
expérimental pour l'émulation de machines de vision, les activités vont désormais privilégier le 
banc multicapteur. Ainsi au plan des réalisations la vision jusqu'ici prépondérante s'associe à 
d'autres sources d'informations. 


- Les réalisations matérielles vont traduire un effort d'intégration accru. Ceci ouvre notamment 
la porte à l'exploitation de potentialités novatrices, analogiques voire neuronales. Ce 
déplacement d'équilibre du câblé vers l'intégré s'accompagne d'une unification des moyens, 
notamment logiciels. | 


- La complexification des architectures matérielles, réalisées ou en conception, souligne plus 
que jamais la nécessité d'une symbiose étroite avec l'atelier logiciel. D'autant que les recherches 
en émulation/diagnostic demandent désormais une programmation accrue, tout comme d'ailleurs 
les machines construites. 


De fait, le laboratoire disposera à brève échéance d'un parc de machine d'application d'une 
richesse peu commune : 

- émulateur HECATE 

- pyramide de P.E SPHINX 

- "caméra" rétines 

- calculateur fonctionnel 

- Connection Machine 

- multiprocesseur MEDCIN 


Enfin, les recherches menées au laboratoire, le sont dans un souci permanent de transfert 
industriel. A cet égard, la période passée aura été fructueuse : 


- Machine de traitement d'images (Sté EIA). 


- Calculateur symbolique (Sté SODIMA), avec réalisation d'un VLSI dont le CELAR a 
demandé l'évaluation. 
- Caméra Super CAM (Sté EIA). 


- Et plus indirectement, Rétines réalisées par le GME-IEF pour l'AEROSPATIALE 
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D'autres transferts sont en cours : 


- Calculateur fonctionnel à TRT. 
- Ordinateur numérique SPMD (Sté ETA). 


B3 Activités logiciel 
( Coordinateur P.CLERMONT ) 


B3.1 Présentation générale. 


L'atelier logiciel du laboratoire SP regroupe les personnels et moyens liés à des activités 
logicielles impliquant du parallélisme, au sens très large du terme: 
- systèmes Unix 
- systèmes temps réel 
- algorithmie et architecture logicielle pour des machines massivement parallèles à faible 
granularité. 
- idem, mais pour des machines parallèles à forte granularité ou des machines distribuées. 
Certaines de ces activités, tout en utilisant les techniques logicielles les plus modernes, 
issues de recherches récentes, sont plus orientées définition de logiciel et développement, pour 
satisfaire les besoins logiciel et système des projets du laboratoire (B3.2, B3.3). D'autres sont 
directement des recherches originales, essentiellement dans le domaine des logiciels 
massivement parallèles (B3.4). 


B3.2 Activités système. 


Les moyens informatiques du laboratoire ont évolué dans la lignée des années 
précédentes: en particulier, le laboratoire opte toujours pour des moyens de calcul distribués sur 
réseau local Ethernet. L'uniformité des systèmes sur les différentes machines (Unix, protocoles 
TCP/IP, systèmes de fichiers répartis NES) est un atout particulier tant pour le suivi des 
systèmes que pour les utilisateurs qui peuvent changer de machine sans efforts notables. 

Notons seulement un point qui commence juste à se stabiliser, il s'agit de la norme de 
gestion des écrans multifenêtrages, propres aux constructeurs, qui évolue de manière 
intéressante vers la définition X-windows v11. 

Cette uniformité recherchée des systèmes et environnements présente également 
l'avantage de faciliter les échanges de logiciels avec des laboratoires extérieurs en collaboration. 

_ Le réseau du laboratoire, en fort développement depuis deux ans, est articulé autour de 
deux composantes: 
- le réseau de contrôle de la machine Hécate, qui constitue un ensemble de machines distribuées 
sur réseau destinées à commander les modules électroniques de la machine Hécate. A l'heure 
actuelle, ces machines sont connectées à un sous-réseau Ethernet, et sont constituées d'un 
Sun3/260, pour supporter les logiciels haut niveau de contrôle (interface utilisateur, contrôleur à 
règles "Knowledge Operating System" (KOS), une partie du diagnostic, ….), de deux machines 
sim90 multiprocesseur (chaque processeur contrôlant un module électronique), et de plusieurs 
sim90 monoprocesseur utilisées à des fins de mise au point. Nous avons été amenés à définir 
une méthodologie unique d'écriture des logiciels de contrôle, adaptée à la structure réseau 
(B3.3).[6s C3.1] 
- le réseau général du laboratoire, utilisé pour les développements algorithmiques, qui regroupe 
actuellement différents Sun3, serveurs de fichiers ou non, deux Sun4, une machine SPS7, ainsi 
qu'une station spécialisée en traitement d'images de type VINIX. 
- enfin, avec la montée en puissance des expériences probatoires liées au contrôle multicapteur 
(sous-fonctions complètes de perception, plateforme multicapteur), il est envisagé à court terme 
la création d'un sous-réseau de contrôle de ces prototypes, selon la méthodologie éprouvée sur 
Hécate . | 


Pour conclure les activités système, citons la mise en place d'un accès par courrier électronique 

au réseau FNET, permettant une liaison rapide, efficace, et bien intégrée à l'environnement du 

Chercheur, avec les organismes de recherche internationaux. Cet outil se révèle un instrument de 
travail précieux rapprochant les individus, qui a séduit de nombreux chercheurs sur notre site. 
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B3.3 Développements de logiciel 


Les activités de développements logiciels ont essentiellement porté sur l'extension et 
l'adaptation des logiciels de contrôle d'Hécate, pour intégrer de nouveaux modules. Ceci a 
entrainé un renouveau, tout au moins une clarification supplémentaire, dans la méthodologie de 
conception. 

Les logiciels de programmation d'un banc expérimental en architecture comme Hécate 
sont tributaires d'un dilemme difficile: 

- d'une part, il leur faut un degré de fiabilité et de documentation suffisant pour les 
rendre accessibles à un utilisateur, éventuellement extérieur au laboratoire, par exemple en 
traitement d'images. 
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Structure du réseau SP 


- d'autre part, certains logiciels Sont de niveau recherche (aide à l'utilisateur, diagnostic, 
expertise en intégration),ne sont pas encore stabilisés et ne peuvent prétendre au degré de 
finition ci-dessus. 

Notre réponse à cette contradiction a été de définir une couche logicielle, dite de 
commande, permettant de tout faire sur Hécate, au prix d'une programmation complexe et d'une 
bonne connaissance de l'architecture. Cette couche, de finition soignée, peut être utilisée de 
deux façon: 

- directement, donnant accès à tout moment à un utilisateur quelconque à toute 
ressource, au prix des difficultés précédemment mentionnées. | 

_- par l'intermédiaire des logiciels de recherche, qui s'appuient sur cette couche comme 
outil de base pour le contrôle de la machine. | 
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au sein d'un acteur Chorus 
Architecture des logiciels Hécate 


Rappelons que les développements système pour Hécate ont consisté à réaliser une 
implantation efficace de protocoles d'appels de procédures distants (Remote Procedure Call, ou 
RPC) dans un environnement multisystème. Les logiciels haut niveau, s'éxécutant sous Unix 
(sur Sun ou Sim90) contrôlent les logiciels temps réel de commande des modules, sous le 
système Chorus (V1, pour des raisons historiques). L'outil, implanté sur Ethernet, grâce au 
mécanismes de sockets Unix, et sur une machine multiprocesseur, grâce à une passerelle entre 
systèmes développée localement, permet de rendre transparent au programmeur la localisation et 
les spécificités de chaque module. 

Cette approche, mieux formalisée, conduit à restructurer les logiciels de façon à mieux 
isoler l'aspect commande des modules sur la machine Unix de contrôle principal [ss C3.2]. 
Une retombée naturelle est la possibilité de programmer rapidement un algorithme de TI sur 
Hécate (au prix d'une connaissance approfondie de la machine, puisqu'aucune notion 
d'assistance à l'utilisateur n'apparaît à ce niveau). 


Cette couche logicielle de commande distribuée des modules, ne saurait masquer les difficultés 
de programmation à ce niveau, proche du matériel. Les études ont donc été poursuivies, d'une 
part, pour définir les méthodes de programmation de haut niveau d'Hécate (incluant, d'une part, 
un outil d'aide à la définition d'interface utilisateurs (GENIUS), d'autre part un outil d' aide à la 
configuration de la machine (GATTRID)).[so C3.4] 

Le système GATTRI étudie, selon une approche orientée objet (en liaison avec les 
études du laboratoire sur les environnements de programmation en traitement d'images), la 
gestion automatique des ressources de la machine (opérateurs disponibles, contraintes 
d'interconnexion, contraintes temporelles algorithmiques, besoins en mémoire image 
temporaire... ). 

Le système de diagnostic aborde, de manière générale, les problèmes de détermination 
automatique de l'automate de TI fils, émulé sur Hécate, issu d'un algorithme programmé. Les 
techniques complémentaires utilisées sont d'une part, l'espionnage de la machine (permettant de 
connaître finement l'occupation machine, au détriment de l'information contextuelle globale, 
c'est-à-dire de l'algorithme) et d'autre part diagnostic intégré à la commande, présentant les 
caractéristiques inverses.[és C3.5] 

Ces deux problèmes sont finalisés, dans un premier temps, sur un module exemplaire, 
le module de segmentation COLISE, couplé à un autre module capable de mémorisation 
(NYX). 

Citons enfin, plus techniquement, les point clés d'évolution des logiciels Hécate: 
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- l'intégration des nouveaux modules (COLISE [es C3.6], MORPHEE, NYX) nous a conduit 
à passer à une structure de contrôle distribuée sur réseau au lieu d'une seule machine 
multiprocesseur. Ceci a entrainé les évolutions précitées sur la méthodologie, ainsi que le 
passage sous Système V des processeurs sim90 Unix (au lieu de V7). 

- les logiciels de haut niveau ont été transportés sur Sun (ils bénéficient de l'environnement 
graphique).[és C3.3] | 
- le module de reséquencement nécessitant des temps de réponse très serrés pour son contrôle, 
et son contrôleur sous Chorus ne pouvant le satisfaire, nous avons du ajouter un niveau de 
contrôle (un 68000) supplémentaire, et pour respecter la méthodologie de programmation 
générale, développer un embryon de système adapté pour cette carte.[ss C3.1c] 


B3.4 Recherches spécifiques. 


Les recherches se sont concentrées sur des domaines précis, abordant des aspects 
complémentaires: 
- le parallélisme à faible granularité ("massivement parallèle"), essentiellement du point de vue 
algorithmique et méthodologie de programmation, à travers les projets Sphinx et Rétines. 
- le parallélisme à forte granularité, vu plutôt sous les aspects systèmes et modèles de 
programmation [es C3.7]. Cette étude qui débute, dans le cadre d'une thèse, se propose de 
définir les aspects systèmes de la machine parallèle MEDCIN, dont le matériel est en cours 
d'étude dans l'environnement du laboratoire, et dont les applications sont étudiées 
parallèlement (parallélisation d'algorithmes d'analyse grammaticale en reconnaissance des 
formes, et en traitement d'images). Le laboratoire regroupe donc pour ce projet le triplet 
(concepteur matériel, concepteur systèmes et utilisateurs finaux). 


La démarche commune, pour les études en parallélisme massif, liés à des projets architecturaux 
en liaison avec Orsay/IEF, a été d'évaluer quel est le degré de complexité des:algorithmes 
implantables sur ce type de machine à réseau régulier et figé, mais regroupant plusieurs milliers 
de processeurs. 

Ceci pose deux types de problèmes: 

- l'adaptation de l'architecture, en termes de performances 

- la programmabilité d'applications complexes: l'approche du laboratoire a été d'une part 
langage (rétines), d'autres part, style de programmation et méthodes (machine pyramidale 
Sphinx). 


Les études sur rétines ont conduit à une soutenance de thèse en Décembre 88 [travail 
A.REICHART, algorithmie]. Elles ont porté sur la mise au point d'algorithmes originaux ainsi 
que la définition d'un environnement de programmation basé sur un langage, utilisable par 
ailleurs pour d'autres activités de TI du laboratoire. | 

Les études sur Sphinx ont consisté en l'implantation d'algorithmes complexes de TI (non 
réguliers), ainsi que l'étude et la généralisation des mécanismes en cause. En particulier, on a 
montré l'intérêt des graphes sur Sphinx,contrôlant des mouvements ascendants (concentration 
d'information) ou descendants (diffusion d'information): [ss C3.8] 

- le simulateur a été transporté sur Sun, les performances atteintes permettent de simuler des 
algorithmes d'une complexité réaliste sur des images 256x256 en des temps compatibles avec 
l'interactif (mais non temps réel comme sur la machine finale). | 

- différents algorithmes de traitement d'images ont été étudiés, le plus complexe étant un 
algorithme multicritère de segmentation en régions, très dynamique et évolutif. Les 
performances attendues sur machine réelle, déduites de la simulation sont très prometteuses, 
pusiqu elles satisfont aux contraintes de temps réel image. 

- l'extension de la simulation a conduit à définir une architecture des logiciels de contrôle 
implantant différents niveaux d'abstraction de l'architecture matérielle, destinés à rendre la 
machine plus programmable. Ces travaux ont été effectués en liaison étroite avec l'équipe IEF 
impliquée par la réalisation de l'outil de développement final. | + 


B3.5 Conclusion et perspectives 


L'année 1989 à venir devrait permettre de développer l'expérience de l'équipe dans différents 

domaines complémentaires du parallélisme, d'une part en simulation logicielle, d'autre part avec 

la disponibilité des premières maquettes matérielles (maquette Sphinx, de base 32x32, caméra 

rétine, calculateur fonctionnel, démonstrateur de la machine MIMD/SPMD Medcin). Suivant les 
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projets, les études se poursuivront (sans exclusive) plutôt vers les aspects système/langage, ou 
les aspects algorithmie. 

En dehors de la pratique acquise sur ces maquettes, complètement maîtrisées localement (ou en 
collaboration extérieure étroite), il est prévu la mise en place du Site Expérimental en 
Hyperparallélisme, équipé initialement d'une machine massivement parallèle de type Connection 
Machine, qui constituera une structure d'accueil multidisciplinaire pour des expériences de 
programmation parallèle. A cette occasion, l'équipe a déjà acquis en 87/88 une expérience sur 
Connection Machine, facilitée par les études menées localement sur les architectures 
massivement parallèles. 


B4 Algorithmie de Traitement d'Images 
(Coordinatrice V. SERFATY) 


B.4.1 Présentation du cadre des recherches 


L'un des faits essentiels en Algorithmie de Traitement d'Images est le recentrage des activités de 
recherche autour d'un thème fédérateur axé sur le concept de Segmentation multi-critères / 
multi-modèles. | 


Un problème majeur en Vision, que ce soit pour la robotique mobile ou plus généralement, pour 
l'interprétation de scènes naturelles, concerne la Segmentation automatique des images en sous- 
domaines signifiants, correspondant à des entités potentielles de la scène. Etant donné son 
importance "stratégique" et son caractère inéluctable, cette étape nécessaire à tout processus de 
perception "visuelle" fait l'objet de travaux nombreux et diversifiés, tant sur la détection des 
primitives à considérer que sur les modalités et stratégies de reconnaissance et d'interprétation. 


Comme en témoigne l'abondante littérature spécialisée traitant des aspects purement Traitement 
d'Images, et les avancées de l'Intelligence Artificielle dans ces domaines, la majorité des 
travaux aboutit à des développements adhoc, plus ou moins adaptés à des applications 
spécifiques; il en résulte une grande variété de techniques, voire d'heuristiques de segmentation 
dont 1l semble difficile a priori de déterminer les domaines de validité, et a fortiori, d'expliciter 
les fonctionnalités et d'extraire les connaissances mises en œuvre. 


C'est pourquoi, l'atelier "Algorithmie" s'attache à adopter une démarche commune en vue de 
systématiser l'étude des algorithmes de Segmentation et de dégager des mécanismes de 
résolution généraux. Plus précisément, les développements intéressent principalement 
l'extraction de primitives images comme les points d'intérêt, les contours, les régions et le 
mouvement dans une optique résolument coopérative; les critères impliqués s'appuient alors sur 
des propriétés diverses, classiques d'homogénéité ou de disparité, ou plus subtiles de 
déformation, d'indices texturels.… | | 


Pour l'étape de reconnaissance, assez volontiers inspirée du schéma classique de type 
Prédiction / Vérification, plusieurs solutions algorithmiques de la mise en correspondance entre 
les primitives 2D extraites de l'image et des modèles de scènes 3D, sont examinées. Il convient 
de signaler ici, que suivant l'application visée, la notion de modèle est loin d'être restreinte à la 
géométrie. Elle peut recouvrir des degrés de complexité variable tant algorithmique que liée à la 
représentation des connaissances requises : phénomène physique sous-jacent, modélisation et 
contraintes géométriques, informations contextuelles ou contingentes. 


Les études engagées sont validées suivant des axes d'application immédiats. Se retrouve en 
premier lieu, par forte continuité avec les thèmes de recherche antérieurs, l'analyse de scènes 
dynamiques mais englobant les notions de mouvement et déformation. Ces travaux ont prouvé 
leur parfaite adéquation dans des contextes de poursuite multi-cibles (suivi et identification) 
obéissant à des objectifs opérationnels variés (guidage terminal [ 6 C4.6], surveillance et 
reconnaissance aériennes à grande distance) [ 6 C4.1]. Conjointement, ces tests effectués sur 
des séquences de données (infra-rouge, visible) ont permis d'évaluer des techniques 
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d'appariement à la fois temporel et spatial. La maîtrise de ces techniques autorise l'expertise de 
systèmes industriels (Intertechnique), puis le transfert de résultats récents (Sat), des 
collaborations plus étroites sous contrat Cifre où le laboratoire assure l'encadrement scientifique 
d'un étudiant en thèse au profit d'une société industrielle (Aérospatiale) liée avec les services de 
l'Armement. Les activités d'expertise sont supportées et vivement encouragées par le groupe de 
coordination technique Dret Gct/Gtp et devraient s'étendre dans l'avenir; de même pour les 
transferts algorithmiques sous l'égide du Service Des Recherches de la Dret. Dans le cadre des 
formations qu'il dispense au service de la DGA, le laboratoire Système de Perception donne 
accès à ses matériels, et à l'environnement de Traitement et Synthèse d'images; il met également 
à disposition son expertise technique et algorithmique ainsi que le personnel d'encadrement 
nécessaire. | 


B.4.2 Environnement dédié 


La première difficulté pour tester efficacement le comportement global des algorithmes de 
Traitement d'Images est d'obtenir des données reflétant des situations conformes aux contextes 
opérationnels. En second lieu, les difficultés inhérentes à l'évaluation des algorithmes 
proprement dits sont liées à la définition et à la corrélation des divers critères fonctionnels 
impliqués. Ce double aspect nous a conduits à définir une méthodologie systématique qui 
dégage les fonctionnalités d'un environnement informatique de développement et de test adapté 
à nos activités. 


Afin de favoriser une réelle et efficace interaction des recherches et des cadres d'application 
envisagés, le laboratoire s'est alors doté d'un outil logiciel lui assurant les moyens 
(informatiques) nécessaires à l'établissement d'une part, de scénarios réalistes (Données), et à la 
définition d'autre part, de Fonctions de Traitement d'Images entrant dans la composition d'un 
Schéma fonctionnel de résolution (Algorithmes). 


Les algorithmes sont élaborés par l'ensemble des chercheurs du laboratoire suivant la 
méthodologie de conception commune, concrétisée par l'exploitation de l'environnement de 
développement spécialisé. Son utilisation devenue systématique assure et facilite une nécessaire 
cohésion et coordination entre les diverses voies de traitement étudiées. Ainsi, l'ensemble des 
études s'appuie sur deux composantes qui constituent le cœur du système: un outil de synthèse 
et de simulation, Salsa, un environnement de programmation dédié au Traitement d'Images, 
Lampion. 


À la faveur du renouvellement de la configuration informatique du laboratoire pour des 
machines alliant des interfaces utilisateurs conviviales et des outils de développements plus 
performants (réseau de stations de développement Sun et machine de Traitement d'Images 
Vinix), la transposition logicielle de ces deux composantes primordiales a permis d'améliorer 
sensiblement les qualités des produits initiaux en respectant les principes conceptuels déjà 
validés.-Dans sa globalité, la réécriture de l'ensemble des algorithmes développés sur l'ancien 
calculateur Gould Sel 32/87 est achevée. 


B.4.2.a SALSA: Outil de synthèse et de simulation 


L'utilisation d'images de synthèse constitue, jusqu'à ce jour, un moyen fiable et rapide 
d'estimer, dans un environnement aussi réaliste que possible, les performances de traitements, 
lorsque leur schéma fonctionnel directeur a été isolé. 


Dès lors, l'outil de synthèse autorise la génération de scènes et l'exécution des algorithmes en 
boucle ouverte ou fermée; modulaire, il permet de simuler aisément des scènes évolutives, 
terrestres ou aériennes, vues par un senseur Infra-rouge mobile ou fixe; générées sur des fonds 
naturels, pour des besoins spécifiques Défense, les entités synthétiques sont suivant le type des 
scénarios considérés des “mobiles” (char, avion), des éléments naturels (relief, arbre), des 
perturbations artificielles (fumigène, éblouissement laser). 


Des facilités ergonomiques non négligeables, en font notamment un banc d'aide à l'évaluation 
de systèmes de poursuite, un générateur de séquences d'images fournissant des scénarios 
opérationnels synthétiques que l'on modifie au gré de l'évaluation des algorithmes. En effet, la 








Image spot (1 bande) quelque part dans l'Est de la France 
et le modèle numérique de terrain correspondant. 


Approche de missile sur ce site synthétisée à partir 
d'un placage de l'image sur le MNT 
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généralisation de l'outil a été entreprise afin de parvenir à générer dans les domaines infrarouge 
et visible des images stéréoscopiques, des scènes d'intérieur ou d'extérieur avec un fond réel ou 
artificiel : une interface utilisateur conviviale a été intégrée à partir des bibliothèques graphiques 
standards. La mise en place de nouveaux modèles d'objets et l'intégration de divers modes de 
synthèse ont été réalisées ou initialisées : création de fonds en "relief" d'après un modèle 
numérique de terrain, adaptation des structures géométriques créées sur machine Lisp 
Symbolics 3670, lancer de rayons, modèles d'illumination pour le visible, amélioration du 
réalisme des scènes ou des objets par placage texturel (collaboration scientifique avec le 
laboratoire de A. Gagalowicz à l'Inria).[ 6e C4.9] 


En tant qu'outil, mis à la disposition des membres du laboratoire (mais aussi au service de la 
Dret et de ses industriels) ce logiciel fournit de façon rapide et confortable, les banques 
d'images nécessaires à la validation des développements algorithmiques effectués. Les images 
synthétisées sont le reflet de situations particulières (scènes réalisées dans un cadre parfaitement 
maîtrisé), et spécifiées sur la base de scénarios décrits par un expert en se référant à sa propre 
application. Enfin, la mise en place d'une cellule aux normes "Confidentiel Défense" répond 
aux exigences de certains développements en matière de protection. 


B.4.2.b LAMPION: aide à la programmation 


Issu des recherches et travaux entrepris les années précédentes, dans le cadre de la conception 
d'un système d'aide en Traitement d'Images, la deuxième version de l'outil d'aide à la 
programmation LAMPION (Logiciel d'Aide à la Manipulation et à la Programmation d'Images et 
d'Opérateurs Numériques) est opérationnelle. L'approche est plutôt Génie Lo giciel, la 
population ciblée est plutôt celle des concepteurs d'algorithmes, sans préjuger d'une assistance 
structurée et méthodique à tous les utilisateurs. 


Les travaux d'adaptation ont consisté en la réécriture en langage C (et en shell Unix") du 
noyau et des interfaces utilisateur, la transcription C des types de données Images (image, 
image_binaire, contour, région, chaîne...) et des fonctions de manipulation associées; des 
utilitaires de correspondances hiérarchiques entre les différents niveaux de traitement assurent la 
transparence avec les structures internes autorisées par les machines considérées [ 6 C4.5]. Les 
traitements sont écrits en langage C agrémenté du. sur-ensemble (types et manipulations) 
spécifique Image, leurs primitives fonctionnelles apparaissant sous la forme d'opérateurs 
“paramétrables" (où ici les paramètres sont des fonctions validant des critères impliqués). A 
partir de cette base, l'intérêt majeur porté à la Segmentation conduit naturellement à définir et 


affiner certaines classes de critères afin de typer efficacement des stratégies coopératives entre 
diverses primitives. | 


B.4.2.c Base descriptive d'al gorithmes 


Afin de parvenir à un système de description et de programmation fonctionnelles des 
algorithmes de Traitement d'Images, alliant des aspects de programmation à des notions plus 
cognitives, une recherche parallèle s'inspirant de l'organisation des systèmes à base de 
connaissances, porte sur une décomposition des algorithmes instituant un langage commun 
pour la description de leurs propriétés. Les bénéfices d'une telle décomposition sont de définir 
de nouveaux types de données s'organisant en trois niveaux : objets, opérateurs, associations 
d'opérateurs schématisant un algorithme. Une structure de données, appelée Mécanisme, a alors 
été introduite, représentative des propriétés fonctionnelles de ces associations. [ 6 C4.2] 


Le dialecte Le_lisp et ses extensions orientées "Objet" permettent de coder efficacement les 
fonctions des algorithmes. Afin de progressivement mieux sérier les attributs descriptifs des 
instances (schémas d'algorithmes décomposés), des procédés de comparaison et de 
généralisation sont définis à partir d'un langage de représentation par Frames FOVL. Cette phase 
devrait engendrer différentes facettes du système d'aide à la conception d'algorithmes. A plus 
long terme, un tel outil devrait permettre de constituer les premières versions d'une véritable 
base de connaissances codant le savoir-faire ou une "expertise" opératoire. 
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kdefine GENRIMAG S2BTIMAG /* Image VINIX */ 


main(argc,argv) 
nt argc; 
har *argv{]; 


char *pname = *argv; 
ERRC OTImaxdir(); 
OTI *isrc, *ides; 

OTI *vois; 


Hifdef VINIX RE 
vxinit(); Dé": Sr | 
| isrc = VXIMAGcrea(nlig,ncol, GENRIMAG,nesq,mult,*++argv); A 0) 
\ . = vxIMAGcrea(nlig,ncol, GENRIMAG,nesq,mult,*++argv); { 
D Sr OTEy:y #define IMAG_GR S2BT 
Hendif VINIX ; #define VALG_GR S4BT 
vois= VOIScrea(VOISRECT,,nesq,mult); hrs . #8 là 
| VOISinit(OTI_VOIS(vois),hvois,lvois,xvois,yvois); / mr ES ve gps de l'opérateur atomique */ 
| ExitlfErr(OTImaxdir(isre,vois,vois1,ides)), VOIS OI VOIS (vois): 
OTlfree(isrc); OTIfree(vois);,OTIfree(ides); VALG *grad1=V ALGcrea(S4BTVALG); 
, . er for (i=VOIS_X(voisin); 1< NLIG_IMAG(OTI_ IMAGt(src))-VOIS_X(voisin);i++){ 
Helse COMMANDE F WE © routine mise en bibliotheque <<< */ for(j=VOIS_Y(voisin); j< NCOL_IMAG(OTI_IMAG(src))-VOIS_Y (voisin); j++){ 





for(k=i-VOIS_X(voisin);: k< i-VOIS_X(voisin1)}; k++){ 


VALG_VAL(grad1) += IMAG_VAL(OTI_IMAG(src).jdr,k); 
VALG_VAL(grad2) += IMAG_VAL(OTE IMAG(src).jga.k); . 
jdr ++, es 
if(jdr > jidr=; 

re 
+ 1(jga < j)jga=); 
| jga=j-+ VOIS_Y (voisin); 


jdr=j+1-VOIS_Y (voisin), FE 
for(k=i+VOIS_X(voisin); k> i+VOIS_X(voisinl); k--){ 


| VALG_VAL(grad1) += IMAG_VAL(OTI_IMAGsrc).jga;k): | 
VALG_VAL(grad2) += IMAG_VAL(OTI_IMAGt(src),jdr,k); . 

jdr++; de 

| 1fGdr > j)jdr=;; 

D  . | : 

is < j)8a=); 

VALG_VAL(ismax1)=MAX(VALG_VAL( gradl ) VALG_VAL( grad2)); 

Pr. | ES 

… poursuite des traitements dans les autres directions 


|} 
VALGfree(gradl); 
… libération des structures 


} 

#undef VALG_VAL 

#undef IMAG_VAL e 
#endif COMMANDE “2 


Application à un tableau (Pissaro) d'un algorithme de détection d'objets brillants 
(formation de chars en IR...) 


- Sur fond de programme dans l'environnement LAMPION/OTT et de haut en bas: 


- original 
- mise en évidence de motifs englobants 
- détection guidée et par seuillage adaptatif des détails brillants 


On obtient dans ce cas l'équivalent du même paysage urbain de nuit! 











Conformément à la méthodologie préconisée, les opérateurs étudiés et implantés concernent des 
traitements de bas niveau qui transforment un objet (concept) de Traitement d'Image (Image, 
Contour, Région...) pour le convertir en une autre structure symbolique. Leur décomposition a 
permis de mettre en évidence des opérateurs “génériques”. Une première "classe" préparation 
des données (de type Image — Image). Une seconde plus spécifique, permet la détection 
d'objets considérés comme primitives pour les étapes de reconnaissance et d'interprétation 
(Image — Points, Contours, Régions...). Chaque opérateur de conversion peut être 
décomposable selon des mécanismes plus fins, dont l'enchaînement est à son tour assuré par la 
validation de critères et contraintes attachés aux propriétés de l'objet. 


Les traitements ultimes de reconnaissance ou plus généralement d'interprétation font appel à une 
.- Connaissance a priori des objets à extraire, ainsi que de leurs interdépendances. Cette 
“connaissance peut être codée sous la forme de réseau sémantique. Sa traduction en termes 
d'objets de traitement d'images dépend des conditions expérimentales et fonctionnelles. Ce 
principe est utilisé actuellement dans le cadre d'un projet OTAN [ 63 C4.1], dont le but est la 
reconnaissance de cibles en formation et l'interprétation de configurations conflictuelles via des 
méthodes de prédiction-vérification. | 


B.4.3 Les pôles d'intérêt Image 


Toute tentative de conception d'un système de perception automatique suppose deux 
composantes au cœur du système : les modules de Description (des Pixels aux Symboles) et 
d'Interprétation (des Modèles aux Critères). La description, résultant de la Segmentation, 
produit une représentation symbolique de l'image en terme d'indices visuels; l'objectif de 
l'interprétation est d'établir une correspondance entre les symboles détectés, supposés 
appartenir aux entités recherchées, et leurs modèles. Les systèmes d'analyse sont attribués à une 
des trois catégories usuelles (déductif (modèle -; données), inductif (données -> modèle), 
mixte) qui ne diffèrent que par l'organisation de leurs éléments fonctionnels de base (extraction : 
de primitives, représentation symbolique, interprétation sémantique), le contrôle effectué (dirigé 
_ par les données, guidé par le modèle, ou hybride...) et la "quantité" de connaissance a priori. 


B.4.3.a Des Pixels aux Symboles 


La première étape consiste à définir des Opérateurs de Traitement d'Images dont la fonction peut 
se résumer à l'extraction de primitives; ces primitives, bien que leur formulation précise 
(mathématique ou autre) soit sujette à bien des controverses, sont reconnues classiquement en 
les termes de régions, contours. | 


… L'intérêt du laboratoire, à l'intérieur de ce vaste thème de la Segmentation, s'est porté depuis 
_ maintenant près de sept ans sur les primitives Points, Contours, Régions et surtout Mouvement. 
Différentes “versions” fonctionnelles ont été mises en œuvre. 


A noter pour les Points (anguleux, caractéristiques, d'intérêt), des inspirations d'extracteurs du 
type Priam, Moravec, "coins", points chauds, points de courbure nulle ou maximale...[ 6s 
C4.1, C4.6] A ce titre, des transferts algorithmiques au profit de la société SAT sont en cours de 
réalisation, en vue de leur application au guidage terminal d'un autodirecteur air-air à imagerie 
infrarouge. Pour des contraintes technologiques dans le cadre industriel considéré, des 
solutions intermédiaires ont été définies aboutissant à l'obtention de zones d'intérêt connexes, 
préalable à la poursuite: l'affaiblissement des critères validant les points caractéristiques a 
conduit à la détection de bords chauds dans les zones de contraste, l'extraction des cibles est 
_ réalisée par seuillage multiniveaux (niveaux calculés en fonction des primitives points), suivi 
d'une décomposition de l'image en composantes connexes de points caractéristiques. . 


Les détecteurs de Contours étaient plutôt classiques dans la filiation filtrage ou Marr, Hilldreth, 
Canny [ 63 C4.8]. On est revenu plus récemment à des opérateurs par propagation de points. 


#P 


Pour les Régions, un fort accent est mis sur l'étude de techniques d'accroissement, en 
favorisant des critères d'agrégation variés, et dont le contrôle obéit à diverses stratégies (accès 
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Traitements d'images solaires 


(raie H-a }: 


détection automatique de: 
structures magnétiques 
(filaments et facules) 





Original, préparation géométrique et en luminance pour 
traitement automatique.résultats filaments/facules séparés 











séquentiel, aléatoire, contraint par des indices de validité, guidé par un modèle). Les attributs 
(propriétés) des régions "mesurent" dans un schéma plus simple de classification des notions 
d'homogénéité classiques (combinaison de prédicats); on notera cependant la reprise de 
l'analyse texturelle en collaboration avec le laboratoire de A. Gagalowicz à l'INRIA. Fin 88, une 
collaboration avec le laboratoire de Traitement d'Images de l'ONERA a été instaurée sur les 
méthodes d'extraction de primitives, le choix de leurs attributs dans une perspective 
stéréovision. 


Nous ne saurions oublier la primitive Mouvement, identifiable dès cette première phase, par 
exemple par la détermination du flot optique [es C1.3] ou par l'appréhension de la déformation 
[se C4.7], et les notions de vision préattentive ou fruste [es C4.10, C4.11], qui continuent 
d'être l'objet de nombreux développements. Sur ce thème Mouvement, le laboratoire a été invité 
à présenter l'état de ses recherches et leur application à la poursuite à plusieurs conférences 
(GRECO TSI, Ecole d'Automne Thomson).[ 63 C4.4] 


L'étude de phénomènes turbulents avait déjà été engagée sur images de synthèse pour élaborer 
des techniques permettant la mise en évidence de la composante "déformation" à partir de 
modèles de texture. Actuellement ces activités ont trouvé une motivation plus concrète en la 
validation de modèle physique par l'analyse des déformations spatio-temporelles (i.e 
mouvement et déformation), ici appliquée à l'étude de la dynamique des structures magnétiques 
observées à la surface du soleil.[ 63 C4.7] Ces structures et leurs mouvements reflètent 
l'évolution du fluide sous-jacent. L'utilisation du Traitement d'Images permet d'analyser 
(d'extraire et de caractériser la "forme" et le mouvement) des manifestations perceptibles de ces 
phénomènes (facules, taches, filaments..) pour mieux comprendre la dynamique des fluides 
qui régit leur évolution. Des contacts avec l'Observatoire de Paris (Unité CNRS de Meudon) ont 
initialisé une première analyse quantitative. A partir des séquences d'observations, l'existence 
d'une circulation à grande échelle, "les rouleaux", a été validée, elle semble être responsable des 
variations solaires (variabilités magnétique, du diamètre et de la luminosité) et de leurs 
conséquences sur l'ionosphère et le climat. Ce régime dynamique organisé peut paraître 
Surprenant dans un milieu hautement turbulent comme la zone convective solaire. C'est la raison 
pour laquelle il est important de comprendre les conditions critiques de formation des rouleaux, 
leurs propriétés et surtout leur évolution temporelle. 


De manière générale, divers mécanismes de segmentation ont été introduits dont l'objet est 
d'établir, plus systématiquement, des stratégies coopératives pour la mise en évidence des 
primitives. Pour ces techniques, on procède, soit par une utilisation véritablement conjointe des 
attributs inhérents à chaque primitive impliquée (points / régions, régions / contours, contours / 
points d'intérêt...[ 6 C4.7, C4.6] par exemple soit par accroissements conditionnés, soit en 
privilégiant une primitive en vue de la détection d'une autre (Intérêt — contours, points; 
déformation texturelle -; Mouvement, Régions -> Mouvement). 


Sur les primitives Régions, un schéma algorithmique de croissance a été mis en œuvre; cette 
classe de techniques, bien connue au sein du laboratoire, conçue sous forme fonctionnelle a été 
transférée aisément vers l'atelier d'Electronique [ 6 C4.3]. Cette écriture a permis en outre de 
tester la méthode implantée moyennant l'utilisation de différents critères d'agrégation (moyenne, 
minimum/maximum, variance, médiane...) sur des informations de niveaux de gris, texture 
locale, distance, mouvement. Ces derniers font apparaître les différents modes décisionnels 
contrôlant la fusion de régions adjacentes. 


Il est souvent difficile d'expliciter les connaissances que les stratégies du heuristiques de 
segmentation recouvrent. Cette connaissance peut se situer à deux niveaux : il peut s'agir d'une 
connaissance a priori sur le contenu de la scène et/ou sur le type d'éléments particuliers 
auxquels on souhaite s'intéresser, ou au contraire d'une connaissance de nature plus générale, 
indépendante du type d'images étudiées. Sur un certain nombre d'applications spécifiques, les 
interactions des connaissances a priori sur la scène avec la stratégie de contrôle de la 
segmentation sont abordées via des exemples illustratifs dans les paragraphes suivants. 
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Exemples de segmentation coopérative 





points/régions: les points d'intérêt initialisent la croissance de régions, 
les régions permettent d'élaguer ou compléter l'ensemble des points. | 
Le procédé accroît la robustesse dans les passages difficiles mais la continuité temporelle est : 

encore nécessaire pour éliminer certaines régions parasites issues de points d'intérêt du paysage. 





b 
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points/segments: l'extraction de formation de chars équivaut dans le 


cas d'une file "linéaire" à un passage maîtrisé de points d'intérêt vers des 
segments vérifiables (route. : 
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B.4.3.b Des Modèles aux Critères 
1) Une première influence : les Structures 


Les premiers processus de segmentation extraient un lot de primitives qu'il convient d'agencer 
en une description structurée représentative du contenu de la scène. Ce passage à une 
description plus cohérente, même partielle, nécessite une interaction du modèle supposé avec le 
contenu de l'image. Pour mener à bien la reconnaissance, une étape suivante peut consister, à 
partir des primitives, à définir, puis extraire des "structures" ou symboles, reflets du modèle 
sous-jacent (scène, entité, objectif), ainsi que leur organisation relationnelle. Quelques exemples 
sont donnés dans [ 63 C4.1] pour une transformation de type Points — Segments, dans [.6s 
C4.8] pour Contours — Segments, dans [ 6: C4.6 ] pour Régions — Faces. 


Les primitives et structures sont caractérisées par un ensemble d'attributs dont les valeurs sont 


_ mises à jour au cours de la segmentation et de l'interprétation. Pour leur représentation, on 


s'appuie sur les structures offertes dans l'environnement de programmation dédié: l'ensemble 
des Opérateurs communique et interagit par l'intermédiaire d'Obijets représentant l'état courant 
de la segmentation. 


L'association des structures, malgré les déformations dues au mouvement (séquences 
temporelles ou spatiales) ou au point de vue (images stéréoscopiques) ou à l'action en cours, 
peut être entreprise. L'intention affichée ici est de dégager les points communs entre les 
techniques d'appariement utilisées en stéréo et en mouvement. Jusqu'alors, plusieurs méthodes 
de mise en correspondance ont été validées : programmation dynamique (ee rapports d'activités 
précédents), Prédiction / Vérification [ 6 C4.1, C4.6, C4.8 |. Dans tous les cas, les 
techniques employées s'attachent à perpétuer et adapter le modèle tout au long du procédé de 
reconnaissance. 


Dans un cadre de transfert industriel (SAT), pour des applications Poursuite typiques de 
scénarios air-air, une des méthodes d'association a été réimplantée : la mise en correspondance 
est assurée par un algorithme de programmation dynamique, la forme de la cible étant codée par 
des segments de contour, l'extension à plusieurs primitives et structures est envisagée. 


D'autre part, les éléments de segmentation lèvent certaines hypothèses qui focalisent les 
opérateurs de segmentation sur certaines parties de l'image dans le but de les vérifier en adaptant 
éventuellement les traitements au contexte, 


L'application de telles techniques au cas des séquences d'images infrarouges aériennes de cibles 
terrestres en formation, constitue une approche intéressante au problème précis de la 
reconnaissance aérienne passive tout-temps et à grande distance (participation au groupe de 
recherche OTAN RSG9) [ 6 C4.1]. Ainsi, la reconnaissance d'une formation (ensemble 
d'alarmes alignées) renforce la probabilité d'avoir des véhicules militaires en présence et peut 
conduire à la détection de nouveaux véhicules par extrapolation. Ici, le concept tactique de 
“formation” va se traduire directement suivant un modèle tout d'abord physique, les cibles 
induisent le concept de Point, puis géométrique (leur alignement engendre une structure 
Segment). De même, la présence d'une route peut orienter la recherche d'une formation et 
réciproquement. L'analyse d'images basée sur l'interprétation d'indices contextuels (formation, 


route, obstacle...) doit constituer le cœur de tout système d'interprétation destiné à appréhender 
des scènes complexes. : 


2) Modèles géométriques 


Le rôle central joué par les modèles n'est plus à démontrer; leur intervention s'avère depuis 
longtemps prépondérante dans les schémas classiques d'interprétation. Ils restent ici à un niveau 
de complexité non négligeable, non pas sur le plan des structures primaires qu'ils utilisent, le 
plus souvent géométriques (polyèdres, cylindres), mais sur l'ensemble des contraintes 
d'organisation prédéfinies. Leur définition est supposée correspondre au modèle idéal de la 


scène, et résoudre les transformations possibles (occlusion, distorsion, déformation, points de 
vue...). | 
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Poursuite de cible selon un modèle contextuel de formation 


(a) et (b) prise en compte du type géométrique W,H ou L-igne 


pour la mise à jour de contraintes (terrain...) dans la 
poursuite (certains chars sortent du Champ, se groupent 
pour emprunter la route...) 


rappel de la segmentation 


(mais avec relaxation de 
.. Certains paramètres) 











L'étude d'algorithmes de Reconnaissance des Formes par la mise en œuvre conjointe du 
Traitement d'Images et des modèles tri-dimensionnels permet d'envisager des systèmes de 
perception accomplissant des tâches de surveillance, de navigation automatique ou de 
manipulation d'objets. Dans tous les cas, le choix des symboles fiables relève de la stratégie 
mise en œuvre afin de limiter l'explosion combinatoire des processus d'appariement. 


Relatives à cette approche classique en Vision, deux recherches mettent en œuvre des modèles 
similaires pour des tâches de reconnaissance d'environnements: la première se focalise sur le 
problème de l'appariement entre des primitives visuelles 2D et indices 3D prédéfinis dans le but 
d'identifier des constructions ou structures naturelles significatives [ «> C4.8]; la seconde a 
pour objectif la construction incrémentale d'un modèle 3D de l'environnement, inconnu a priori, 
par des techniques conjointes de stéréovision et de mouvement. [ & C4.6] 


La représentation géométrique choisie se calque, dans les deux cas, sur les modèles actuels de 
synthèse et permettra à terme la regénération d'images, simulant ainsi la perception visuelle 
d'un engin autonome. L'outil de simulation peut donc être utilisé comme un moyen de 
prédiction des observations à partir de modèles 3D. 


Ceci explique l'importance des recherches menées sur ce thème ces dernières années. Le point 
dur de ces techniques reste cependant, d'une part, la mise en correspondance automatique de 
structures issues d'une analyse monoculaire des images, à partir de primitives extraites et 
d'autre part, la reconstruction d'un modèle 3D de la scène résultat de la mise en 
correspondance. 


Outre les aspects qui privilégient de nombreux échanges entre les modules de segmentation et de 
reconnaissance, cette approche met en oeuvre des techniques de stéréovision, et de mise en 
correspondance nécessaires à tout système de perception destiné à observer et à analyser son 
environnement 3D. Actuellement, les environnements explorés sont limités à des scènes 
d'intérieur ou à des scènes naturelles simples prises de vue aériennes de zones urbaines. La 
mise en place d'une plateforme expérimentale multicapteur et les études engagées sur le thème 
de la coopération de sous-fonctions complètes de perception, justifie le développement toujours 
intensif de cette classe de techniques. 


3) Modèles d'un autre type 


A cela, il convient d'ajouter que l'ensemble des développements algorithmiques s'appuie à des 
titres divers sur la définition de modèles (plus simples, plus flous) destinés à être mis en œuvre 
dès les premières étapes de vision bas niveau (extraction de primitives). Cette "injection" 
précoce de connaissances a l'avantage de produire des ensembles de primitives plus fiables et 
robustes, limitant ainsi les erreurs ou manques de la mise en correspondance ultérieure. 


Les phénomènes physiques liés à l'application permettent d'inférer de nouveaux critères en 
fonction des modèles considérés; plusieurs illustrations peuvent en être données. L'analyse des 
diverses techniques de segmentation est orientée vers la détermination de modèles physiques 
(classiques et/ou originaux) et vers la définition des critères associés, l'intégration des 
opérateurs correspondants (validation d'un critère) est facilitée par les structures d'accueil de 
l'environnement spécialisé. 


Diverses méthodes de détection de cibles de petite taille ainsi que celles relatives à la détection et 
reconnaissance de formations linéaires ont été mises en œuvre. Les résultats obtenus ont mis en 
évidence l'apport fonctionnel des opérateurs de détection, et nous ont permis d'en assurer la 
généralisation, puis de créer l'opérateur" adapté i.e. révèlant les critères répondant au mieux à 
la dynamique du problème : filtrage adapté en taille, luminance, détection de cellules isolées. 


L'application au domaine de l'imagerie Sonar, des techniques de segmentation d'images et de 
reconnaissance de formes, peut apporter une aide précieuse aux industriels développant des 
systèmes de surveillance des fonds marins; ainsi, THOMSON-DASM avait manifesté en 1987 son 
intérêt pour une classe d'algorithmes par croissance de régions et une première étude DRET SDR 
G2 avait été engagée [ 6s C4.3]. Le schéma algorithmique implanté est basé, afin d'assurer une 
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Extraction de mines d'après 
images de SONAR latéral 


La détection de régions exploite 
un modèle du couple écho/ombre 


( a ) frontières des régions 
reconstruites par leur 
moyenne 


( b ) frontières après segmentation 
cuidée "horizontale" 
(prédiction de la source 
SONAR) 


cadrage des couples écho/ombre 
pour accord des procédés précédents 


a 





véritable segmentation guidée, sur un modèle particulier : l'entité utilisée pour détecter des 
mines sous-marines est définie comme un vecteur orienté écho / ombre. Ainsi, la méthode de 
détection vérifie la validité des critères liés, d'une part, aux cellules claires (échos) et d'autre 
part, aux régions sombres (ombres), guidée elle-même par un module d'accroissement prenant 
en compte les critères de taille, position et direction. 


Inversement, dans le cadre de l'analyse de spectrohéliogrammes [ 6 C4.7], à partir d'une 
théorie physique supposée, qu'il s'agit de conforter, voire de préciser, l'introduction des 
premiers éléments préssentis "du modèle" à déjà permis obtenir des résultats intéressants. La 
détection des rouleaux comporte deux étapes: la détermination du champ magnétique à grande 
échelle et de la circulation méridienne associée aux grandes structures magnétiques. 


Les filaments tracent les frontières des structures magnétiques. Pour chaque rotation solaire et 
dans un domaine de latitude donné, on peut définir un indice caractérisant l'importance. Après 
plusieurs rotations, l'indice le plus élevé (présence de filaments) se déplacera d'un domaine de 
latitude à un autre. La détection de ces structures filiformes, leur caractérisation (forme, 
position) permet de déterminer l'évolution de la trajectoire et ainsi de reconstituer la structure 
magnétique à grande échelle réservoir des régions actives. 


Pour l'estimation de la circulation méridienne, l'analyse spatiale et temporelle des jeunes taches 
(en particulier, la détermination de leur rotation) est primordiale, elle permet de savoir si la 
source dynamo (jeunes taches) est localisée dans la zone radiative (rotation rigide) ou dans la 
zone convective (rotation différentielle). La théorie dynamo dépend crucialement de ce résultat. 
On comprendra mieux la raison physique de la convection en rouleaux car celle-ci est 
conditionnée par le profil de la rotation solaire. 


L'autre point crucial est l'analyse de la déformation du champ magnétique, par suivi et 
Comparaison de son évolution (régions actives : facules brillantes) à divers niveaux de 
l'atmosphère (trois "profondeurs" solaires). 


Comme nous l'avons vu, la définition de ce "genre" de modèles relève plus d'une spécification 
physique du phénomène observé et/ou de l'introduction d'informations contextuelles; par 
conséquent, leur expression peut recouvrir des notions très diverses. Des premiers travaux ont 
abouti à la définition d'un formalisme [es C4.1] utilisé dans [es C4.1, C4.7], basé sur la 
construction d'un réseau sémantique codant les attributs des entités recherchées; il s'agit alors 
de projeter (traduire) ces propriétés sémantiques sur un graphe de décomposition fonctionnelle 
Schématisant les opérateurs de traitement à exploiter, i.e. vérifiant les critères validant les 
propriétés dégagées. 


Un dernier exemple de prise en compte des connaissances contextuelles se situe dans le cadre de 
la détection de cibles de petite taille par imagerie thermique aérienne. Le principe de 
décomposition fonctionnelle a permis de dégager le squelette général du module d'interprétation 
alliant les éléments de contexte à la connaissance a priori induite par l'application traitée. 
Différents "scénarios" conflictuels ont été envisagés et notamment l'occultation partielle ou 
totale des cibles au cours de la séquence. De plus, des nouvelles séquences générées par nos 
soins ont complété la base de données du groupe OTAN (environ 50% des données sont 
originaires du laboratoire). Les tests de fiabilité et de robustesse des opérateurs sont effectués 
sur des scénarios conflictuels afin d'appréhender leurs limites et de préciser d'avantage la 
généralisation prévue pour le module d'interprétation. 


Une étude plus détaillée du module d'interprétation effectuée en parallèle concerne la définition 


des mécanismes qui y interviennent et leur interaction avec la sémantique liée à l'application. 


Une représentation sous la forme d'un réseau sémantique permet d'exprimer les connaissances 
en termes d'objets abstraits et de leurs interdépendances. Il convient alors d'exprimer ces entités 
abstraites en fonction des Objets et Opérateurs définis dans l'environnement (représentants des 
Connaissances en Traitement d'Images). 
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Reconnaissance des sites 
en 3 Dimensions 


a) Vue oblique d'une maquette 


b) Image synthétique à partir 
du modèle 3D 


€)  chaînage de contour 
pour restitution d'arêtes 
et reconnaissance 


Photo ci-contre (courtoisie SODIMA) : Largage de charges en soufflerie 


différentes phases du positionnement automatique fin d'après mines | 
(localisation des zones de travail, extraction de contour, détermination d'axe) ù 








B.4.4 Conclusion 


L'exploitation systématique de l'environnement de développement dédié, tant Synthèse et 
Simulation que Traitement d'Images, a contribué à la cohésion actuelle des activités 
Algorithmie. Inversement, une telle méthodologie dont les principes avaient été posés dès 1983 
par B. Zavidovique et qui n'aboutit vraiment que depuis un an, n'aurait pu se faire sans 
l'adhésion collégiale de toute l'équipe Algorithmie qui s'attache à faire vivre et améliorer cet 
environnement en cours de complétion. 


Du point de vue strict de l'implantation, l'écriture des programmes est conforme aux standards 
de définition d'objets (structures C) et d'utilitaires de manipulation (Macro-définitions). 
Lorsqu'un Opérateur de Traitement d'Images s'intègre dans un schéma fonctionnel déjà 
reconnu, sa réalisation bénéficie de la mise à disposition d'un "squelette" (source C) 
l'implantant. Lorsqu'une nouvelle méthode de résolution est isolée, on s'attache à rédiger, sur 
la base de sa décomposition fonctionnelle, un nouvel enchaînement (squelette conforme aux 
spécifications) afin d'enrichir de façon cohérente la base des programmes disponibles. 


Au niveau de la conception proprement dite, le bénéfice d'une décomposition fonctionnelle des 
traitements s'est vu matérialisé ces deux dernières années, par la définition de nouveaux 
schémas algorithmiques, mécanismes de spécialisation de fonctions, voire de généralisation… 
Ce principe a souvent induit l'exploitation systématique de telle ou telle méthode, ce qui se 
traduit alors par son adaptation à l'emploi de modèles similaires et à la validation de critères 
suivant les cas plus "contraints" ou "relâchés". D'inspiration délibérement fonctionnelle, les 
descriptions construites permettent d'exprimer plus aisément, à la fois pour le concepteur et 
pour les éventuels utilisateurs, les divers critères (fonctionnels) mis en avant et les 
caractéristiques (propriétés) des modèles qu'ils sous-tendent. 


La méthode de conception préconisée fournit des Associations d'Opérateurs, et permet un accès 
implicite sur chaque Opérateur en assurant ainsi la définition et le contrôle des Fonctions 
impliquées. De par ces aspects, le logiciel ne reste cependant qu'une première étape vers un réel 
système de programmation en Traitement d'Images, mais dont le principe n'est plus à prouver : 
les productions qu'il a pu engendrer jusqu'à ce jour en sont témoins. 


Nous terminerons, sur quelques rappels des finalités de ces productions algorithmiques : 
collaborations, expertises et transferts dans des cadres industriels, les sociétés SAT, 
INTERTECHNIQUE (sur des thèmes poursuite), AÉROSPATIALE (reconnaissance guidée), et pour 
des directions opérationnelles DCA/STPA (analyse de largage en soufflerie), et plus 


naturellement, au sein du Laboratoire, vers les ateliers Multicapteurs et Electronique à divers 
titres... 
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Poursuite de chars en séquence 
par une rétine TCL 


- image B-codée de 2 chars consécutifs 


- image seuillée puis application 
succéssive des deux composantes 
du traitement 





C. NOTICES INDIVIDUELLES 


CI. Contrôle avancé et modèles multicapteurs/multitraitements 


C1.1 Systèmes de Perception Reconfigurables- 
A. LANUSSE 
(Thèse d'Etat (PARISXT) B.ZAVIDOVIQUE) 
L'autonomie d'un robot (robot industriel, robot mobile, 
système de surveillance) dans un environnement non 
coopératif, voire hostile, nécessite une complexification du 
système de perception afin de dépasser les limitations 
intrinsèques de chacun des capteurs qui ont toujours un 
domaine optimal d'utilisation nécessairement restreint. Dans 
ce contexte, l'utilisation de plusieurs capteurs apparaît comme 
indispensable afin notamment: 
. d'assurer une meilleure disponibilité opérationnelle par 
couverture d'une étendue spectrale plus large et donc moins 
sensible aux changements de conditions. 
. de rendre plus robuste la perception face à des leurrages 
eventuels par l'exploitation d'une certaine redondance entre 
les données des differents capteurs. 
La prise en compte et la fusion d'informations provenant de 
sources multiples est à la base d'algorithmes performants 
d'identification et de reconnaissance par recoupement 
d'informations partielles. L'existence possible de plusieurs 
traitements derrière chaque capteur conduit à envisager un 
système de perception multicapteurs comme une assemblée 
d'entités de traitement, ayant accès à des ressources 
communes (les capteurs et les moyens de calcul), et 
interagissant fortement. Dans ce cadre général, notre activité 
s'est centrée sur l'étude des mécanismes permettant à un 
automate que nous appellerons Robot de 3ème génération de 
suivre les changements de son environnement et de s'y 
adapter au mieux. Cette flexibilité ou capacité d'adaptation 
est en fait le début de ce que l'on appelle communément un 
comportement “intelligent”. Entendons par là qu'elle devrait 
lui permettre, par exemple, de faire face à un certain nombre 
de situations “imprévues" (i.e. de probabilité relativement 
faible) sans recours à l'opérateur humain. La réalisation d'un 
système de perception MultiCapteurs suffisamment 
reconfigurable pour assurer une observation rapide, efficace 
et robuste de l'environnement constitue l'un des principaux 
défis que doit actuellement relever la recherche en Robotique. 
Et ceci pour 3 raisons principales: 
. Son Caractère “canonique”: elle inclue les principales 
difficultés rencontrées dans la conception de robots 
autonomes, y compris des aspects mécaniques souvent non 
[riviaux. 

son caractère "complexe": elle suppose que soient 
parfaitement maîtrisées les interactions calculateur-actionneur 
et calculateur-senseur. 
. Son Caractère "intégré": l'interaction de techniques souvent 
développées indépendamment de perception et d'action 
constitue un problème en soi. 
Notre activité dans ce cadre général a consisté en 2 volets: 
. un volet très appliqué centré autour de la définition et de la 
réalisation d'une station de perception multicapteurs, orientée 
vision. Le problème de l'intégration logicielle et matérielle 
des différents constituants de cette station a été résolue de 
façon originale par le système PARIS aux spécifications 
duquel nous avons participé. Une méthodologie en a été 
dégagée qui permettra dans le futur d'étendre très facilement 
la configuration actuelle pour aborder des expérimentations 
plus complexes. 
. un volet plus théorique motivé par les difficultés rencontrées 
pour en faire un robot autonome et robuste, capable de 
s'adapter ou de se reconfigurer. Une analyse a donc été faite 
des techniques permettant de résoudre ce que nous 
considérons être quelques uns des points durs actuellement en 
matière de conception de robots autonomes: 
. les techniques de modélisation et d'exploitation des 
connaissances a priori, en vue de l'interprétation de 
l'environnement et /ou de la prise de décision. L'exploitation, 
de préférence explicite, de connaissances a priori, est le 
commun dénominateur des approches IA, mais la question 


reste de savoir quels modèles, quelles connaissances utiliser, 


et comment les exploiter? sans compter le problème de la 
représentation de ces connaissances. 


les Problèmes Décisionnels liés au Réglage de la 
Perception en Environnement Non Contrôlé, qu'il s'agisse de 
Contrôle Perceptif {Règlage de Traitements, Prise en Compte 
des Sauts de Fonctionnement, Paramètrage de Traitements, 
etc}, ou de Planification Perceptive { Problèmes Stratégiques 
liés au Choix des Traitements, et à leur ordre 
d'Application}. à 
. les techniques de Fusion en provenance de plusieurs sources 
et d'aggrégation temporelle d'informations perceptives, qui 
peuvent se ranger en 2 catégories symboliques ou 
subsymboliques, suivant la nature des informations 
manipulées. Nous avons donc analysé les possibilités offertes 
par des outils de type Filtre de Kalman, Techniques 
Bayésiennes, Combinaison d'évidence, Champs Markoviens, 
etc, au niveau subsymbolique; au niveau symbolique, nous 
avons exploré les possibilités fournies par les techniques de 
Blackboard pour effectuer le Recoupement d'Informations 
Partielles, et nous avons enfin commencé à aborder le 
difficile problème de l'interaction entre ces deux types 
d'approches aux problèmes de fusion. | 


C1.2 Fusion multicapteur: l'approche stochastique 

X. MERLO ((Thèse (Nancy1) R. MOHR) A.Lanusse) 

La perception multisensorielle des robots à venir pose de 
nouveaux problèmes: en plus du développement de nouvelles 
techniques de traitement du signal, des méthodes d'intégration 
et de reconfiguration seront nécessaires afin de maîtriser la 
complexité du système et de son environnement. A cet effet, 
des techniques d'intelligence artificielle seront probablement 
nécessaires, mais les incertitudes dans la perception et les 
contraintes du temps réel amènent des calculs qui restent du 
niveau de l'analyse, même si les objets et représentations 
manipulées relèvent d'un modèle robotique du monde de 
niveau logique. Nous avons choisi pour ce niveau 
subsymbolique des techniques de filtrage non-linéaires qui 
permettent l'intégration avec un niveau intelligent. A cette 
OCCasion, une extension originale multimodale du filtre de 
Kalman a été développée pour des modèles hybrides discrets / 
linéaires. 

Ces travaux ont été fait en liaison avec le projet de plateforme 
multicapteur, et ont notamment été à l'origine d'un premier 
test d'intégration multisensorielle. Ils ont cependant été 
concrétisés en 87 par deux simulations: la première développe 
le problème canonique du contrôle de la fenêtre d'observation 
capteur, qu'elle résoud par l'utilisation de techniques 
d'allocation des ressources pour les systèmes stochastiques. 
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Teux MmouEn © vitesse constante = 4 


d'erreur du 
maximum de 
vraisemblance 
dens la scène 
(en #) 


% vitesse constante = 5 


% optimisation-limitée 


°C optimisation 





1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 
Rapport Signel/Bruit 


La figure ci-dessus illustre les performances de ces contrôles 
optimisés, par rapport à une méthode classique de balayage 
régulier: | 


Performances des différentes stratégies en fonction du rapport 
signal/bruit : 

La deuxième simulation incorpore un scénario multicapteur 
complexe de lutte antimissile pour un navire de surface: le 
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(a) 


( a ) passe-bas (pyramide isotrope sur la diagonale) 


( b ) passe-bande ( contenu des images élémentaires "homogène", 
résultat plus sélectif) 
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conduisant naturellement à un multitraitement 





système dispose d'une caméra à grand champ et d'un radar, le 
problème étant le contrôle de ce radar en fonction de 
l'estimation de la situation afin d'optimiser le taux de 
destruction des missiles. Ces derniers peuvent arriver avec 
différentes vitesses, et des vagues peuvent apparaître 
aléatoirement et créer des fausses alarmes pendant quelques 
instants. Nous avons ainsi développé une méthodologie 
d'application de ce paradigme probabiliste / bayésien aux 
problèmes de perception robotique: ; 
1) détermination de l'espace des états, avec les différents 
niveaux de description, et les approximations nécessaires 
pour en limiter la complexité 
2) détermination des probabilités a priori 
3) intégration bayésiennes des observations, techniques de 
filtrage en temps réel | 
4) techniques d'optimisation du contrôle, des niveaux 
Capteurs et traitements à celui de la reconfiguration du 
système. 


Situation reelle 


Observation par la camera 


Orientation du radar 


Observation du Radar 


Situetion ectinee 





Visualisation de la simulation de lutte anti-missiles 


Enfin, en 88, outre la soutenance d'une thèse sur ce thème de 
l'intégration et du contrôle de la perception robotique début 
juillet, une étude d'application a été menée avec Jean-Michel 
Frécaut sur un bateau d'essais et de mesures intégrant de 
nombreux radars et capteurs. | 


Techniques probabilistes d'intégration et de contrôle de la 
perception... (Thèse Nancy). 

Contrôle optimal d'un système de perception robotique - X. 
À. Lanusse, B. Zavidovique, IASTED, Genève - Juin 
À Kalman-like filter based on joint discrete and linear- 
gaussian models - ISSPA 87 - Bribasne Australie 
Sub-symbolic techniques for perception system control -X. 
Merlo, B. Zavidovique 22nd ASILOMAR Conf. Pacific 
Grove, Ca - Nov. 1988 


C1.3 Vision multitraitement 

C.MILLOUR ((Thèse (Paris XI) O.FAUGERAS)A.Lanusse) 
Dans le cadre de l'analyse par vision de scènes dynamiques 
complexes et non contrôlées, on étudie les moyens et 
méthodes à mettre en oeuvre pour garantir la faisabilité, 
l'efficacité et la robustesse du processus de perception. On 


adopte la décomposition classique de ce processus en deux 


fonctionnalités: traitements et transformations des données 
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aboutissant à des extractions de primitives d'une part, 
exploitation et interprétation de ces primitives d'autre part, 
sans cependant considérer ces deux fonctionnalités comme 
indépendantes ou autonomes. Dans l'approche présentée, on 
s'attache au contraire à adapter les primitives extraites suivant 
les besoins et possibilités des opérateurs qui les exploitent, et 
inversement à limiter la portée et l'ampleur des analyses 
construites en fonction de la qualité (précision, fiabilité) des 
primitives disponibles. 

Dans cette optique, on s'est intéressé à l'étude et au 
développement d'un opérateur d'extraction de primitives 
destiné à être utilisé dans une phase ascendante d'analyse de 
scènes non contrôlées. L'opérateur choisi est un estimateur de 
champs denses de vélocité optique. On cherche à obtenir une 
indépendance la plus complète possible des performances de 
cet opérateur au type de scène considérée. On y parvient dans 
une large mesure, en mettant en oeuvre des mécanismes 
multi-résolution. L'analyse multi-résolution permet de 
décomposer le problème global d'estimation qui est mal posé 
et mal conditionné en un ensemble de sous problèmes bien 
conditionnés, par traitement séparé des données relatives à 
chaque échelle. On montre en effet que les contraintes 
spectrales introduites par la sélection des seules données 
relatives à une échelle fixée permettent d'élaborer une 
technique différentielle robuste d'estimation, n'exploitant que 
des hypothèses assez générales sur la scène observée. On 
détaille une transformation séparable efficace permettant de 
construire une représentation multi-résolution adaptée à 
l'opérateur développé. 

On s'intéresse ensuite plus particulièrement à l'amélioration de 
la robustesse de l'opérateur par intégration d'informations 
pouvant provenir de sources différentes. Ainsi la combinaison 
des estimations obtenues à différentes échelles permet 
d'étendre le domaine d'application de l'opérateur de base et 
assure de plus une relative immunité au bruit (défini comme 
regroupant tout ce qui apparaît dans les données mais échappe 
au modèle). On est ainsi en mesure de garantir un 
comportement robuste de l'opérateur global et une bonne 
qualité des primitives extraites pour une gamme étendue de 
situations (notamment des mouvements de grande amplitude), 
en subissant cependant les limitations intrinsèques aux 
approches purement ascendantes : le modèle sous jacent à 
l'opérateur d'estimation n'est pas complètement général, et il 
est nécessaire de gérer les cas où il n'est pas exactement 
conforme aux données locales. On propose à cet effet deux 
approches multi traitements, dans le cadre général de 
l'analyse de scènes. Dans la première, l'application parallèle 
de traitements différents (mais estimant les mêmes 
informations) permet de tester des hypothèses formulées sur 
la scène, par invalidation a posteriori des préconditions 
d'application des opérateurs, lorsque les avis ou mesures 
diffèrent. Dans la seconde approche, un premier ensemble de 
traitements est exploité pour contrôler et paramétrer 
l'application de traitements plus précis ou complexes. Dans 
les deux approches, les seules connaissances a priori 
exploitées portent sur l'expertise des opérateurs manipulés. 
Cette expertise a une portée générale et est indéfiniment 
réutilisable. L'analyse exploite également des modèles de 
scènes, mais ces derniers ont un caractère plus contextuel, et 
ne sont pas fournis a priori mais élaborés lors de l'analyse elle 
même. 


Intégration de mécanismes pré-attentifs et analyse pour vision 
de scènes dynamiques 
C. Millour, A. Lanusse - TIPI - Aussois 19-22 AVRIL 88 


C1.4 Traitement du signal et acoustique 
O.MICHEL ((Thèse(ENS Cachan) H.CLERGEOT) 
B.Zavidovique) 
F. Martinerie 
Le problème de localisation de sources sonores en acoustique 
aérienne a continué d'être étudié et développé. 
Le nombre restreint de capteurs acoustiques (microphones à 
electret) et l'environnement "indoor" qui constitue notre 
contexte de travail a pour conséquence d'interdire l'utilisation 
de méthodes "simples" de localisation, telles que formation de 
voie, transformation de Fourier spatiale des données des 
capteurs, etc. | 
Nous nous sommes donc proposés d'aborder le problème par 
les méthodes “haute résolution", appliquées à une antenne 
linéaire formée de capteurs équidistants. Ces dernières 
permettent en outre l'étude de sources multiples totalement 


corrélées entre elles, et par conséquent d'aborder le problème 
de localisation d'une source sonore en présence. d'échos 
importants. Initialement développées pour l'essentiel en 
acoustique sous-marine, ces méthodes s'appliquaient au cas 
de traitement de signaux à bande spectrale étroite. Elles ont 
connu, ces dernières années, un intérêt croissant pour leurs 
applications aux cas de signaux à bande spectrale large. 

Nous avons développé, cette année, une méthode originale de 
construction des vecteurs d'observation de l'antenne, 
permettant une approche par décomposition en éléments 
propres de la matrice interspectrale dans le cas de signaux à 
bande spectrale large. Sa spécificité tient à ce qu'aucune 
connaissance a-priori (même grossière) sur la position des 
sources n'est nécessaire, toute observation effectuée à une 
fréquence donnée appartenant par construction à un même 
espace vectoriel de référence, dit cohérent. 

Eprouvée dans le cas de nombreuses simulations, cette 
méthode est actuellement testée et en passe de donner de bons 
résultats dans le cas de signaux acoustiques réels. Il est à 
souligner que l'aménagement du site expérimental, désormais 
à terme, doit grandement faciliter la mise en place et l'étude 
du comportement des algorithmes étudiés, dans différents cas 
réels, et conduire ainsi à une amélioration sensible du 
comportement du système acoustique-vision qui a été réalisé. 
Nos efforts actuels portent aussi sur l'amélioration du critère 
de seuillage entre signal et bruit, critère dont dépend 
l'efficacité de toute notre démarche. Un critère original a été 
défini et validé en simulation, sa validation sur des cas réels 
est en cours. Nous avons également en vue une prise en 
compte plus fine du bruit, jusqu'alors considéré gaussien et 
décorrélé. 


H. Clergeot & O. Michel: "New simple implementation of 
the coherent signal subspace method for wide band direction 
of arrival estimation". Accepté pour ICASSP 89. 


C1.5 Conception Et Réalisation D'Un Système 
Multicapteur. 

O.DESSOUDE, H.TONCHIA, Y.VIMONT, 
((Stage(E.N.S.T.A. 88) X.MERLO) A.LANUSSE) 

C1.5a Cadre général. 

Le travail exposé ici fut effectué dans le cadre d'un stage de 
fin d'études de l'E.N.S.T.A. Il s'agit d'une première mise en 
œuvre concrète d'un couplage acoustique-vision dans le cadre 
d'une adaptation au cas asynchrone du modèle stochastique de 
surveillance d'automate à deux états développé par Xavier 
Merlo (C1.2). Cette évolution permet un découplage entre la 
scène observée et le dispositif d'observation. Elle tient 
compte, en outre, des temps de traitement, non négligeables 
et très différents selon les capteurs. 


Scènes considérées. 
Rampe de micros 


Site inactif 





Caméra CCD 





Site actif 





Dans un but de validation du modèle d'intégration bayésienne 
de données, nous avons opté pour une scène simplifiée 
mettant en œuvre plusieurs sites (dont le nombre et la 
localisation sont connus à l'avance par le système 
multicapteur) pouvant être actifs ou inactifs (l'activité se 
matérialisant par l'allumage d'une lampe et/ou le 
déclenchement d'un signal sonore sur un haut-parleur). Le but 
fixé pour notre expérimentation est d'assurer une surveillance 
de notre scène (qui évolue en fonction de scénarios pseudo- 


aléatoires pilotés par ordinateur) en parcourant ces sites ou 
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points-sensibles de façon intelligente et économique et en 
utilisant les ressources perceptives hétérogènes constituées 
par l'image reçue par une caméra CCD et par le son capté par 
une rampe de six microphones. Nous réalisons ainsi une 
fusion de données bicapteurs pouvant, moyennant des 
modifications mineures, être étendue à d'autres capteurs 
encore (microphones ou caméra supplémentaires, voire 
capteurs d'autres types). 

Les problèmes posés sont, d'une part, ceux liés à 
l'hétérogénéité des données et à leur fiabilité variable (et 
spécifique du type de capteur considéré), d'autre part, ceux 
liés à la gestion d'un ensemble de ressources limité, au choix 
du traitement à effectuer à chaque instant, du site à observer 
pour la caméra, de l'utilisation efficace du flux de données 
qui parvient à la station de contrôle. Ainsi, les différents 
traitements possèdent des caractéristiques très différentes 
(temps de traitement, précisions des données) et il importe 
d'utiliser toute l'information qui est à notre disposition (sans 
gaspiller des données qui nous arrivent avec un certain retard, 
ni accorder une importance excessive à des données suspectes 
d'erreur). De plus, des choix doivent être faits (pour le 
déplacement de la caméra en particulier) et il convient d'opter 
pour ceux qui a priori nous apporteront la plus grande 
quantité d'information possible. 

C1.5b Aspects théoriques. 

1) Calcul de probabilités de transitions. 

La scène est modélisée par une suite de n pixels 
indépendants (xi)i=1.n, chacun pouvant prendre les valeurs 
0 ou 1, correspondant à l'activité de _chaque site. L'évolution 
de l'état d'un pixel se fait de la manière suivante: si à l'instant 
t0 (le temps ne varie plus par sauts discrets mais de manière 
continue) un pixel est éteint (resp. allumé), la date t de son 
allumage (resp. de son extinction) obéit à une loi de Poisson 
de paramètre 1 (resp. m), de densité de probabilité : 


Re dit (resp. Lie HEtoQr) 


Il reste à exprimer la probabilité de transition de l'état éteint 
vers l'état allumé d'un pixel entre les instants t0 et t. On 
remarque que cette transition peut se faire de nombreuses 
manières différentes: pour tout n20, n+1 allumages et n 
extinctions survenues entre t0 et t donnent un état final où le 
pixel est allumé.Cela peut s'exprimer, avec des notations 
évidentes: 


n= 
(n) 
Poitt-to)= > Po:tt-to) 
n=—0 


puisque les événements élémentaires sont à l'évidence 
disjoints. 
Pour le terme d'ordre n, on trouve: 


t t 
PL (t-t0) = dt(e At 110 | dtauenta D... 
to 


t1 
| db me Mt2nr1t2n) [ | dtans ape Hft 2n+2t 2n +) )..) 
tn t 


qui ne fait qu'exprimer qu'une première transition a lieu à la 
date t1 entre t0 et t, que cette transition obéit à une loi de 
Poisson de paramètre 1, qu'elle est suivie d'une autre transition 
à l'instant t2, etc, ainsi que le montre le dessin suivant: 


lampe allumée! .......… 





lampe éteinte 
t0 t1  t2 t3 tan 


ten+1 t 
Pour l'ordre de grandeur des paramètres envisagé, on montre 
qu'il est inutile de calculer les termes au-delà de n=1. Pour les 
termes d'ordre situés en deçà de cette limite, de calcul 
complet de l'intégrale multiple est possible et donne les 
résultats suivants: 





pour n=0, on a p{(tt0) _ (AH -eut40) 


2 
pour n=1,ona pO)(t-to) "5. 


(AU) 
(AL) (t-t0) (49 + eh )42 (et O - SH +) 


2) Intégration bayésienne d'observations. 

Le modèle du robot de surveillance n'a pas accès directement 
au vecteur d'état (xit)i=1...n à l'instant t mais à travers un 
vecteur d'observation (yit)i=1...n éventuellement entaché 
d'erreur suivant une densité de probabilité p(ylx). Le vecteur 
d'observation peut être d'une nature différente du vecteur 
d'état auquel il n'est lié que par cette probabilité qui va 
permettre l'intégration des données par la formule de Bayes. 
La prédiction donne pour chaque pixel i, en notant 
(p'it)i=1...n le vecteur des probabilités prédites à l'instant 
t,prédites à partir des observations antérieures. 


p'=P(x=1 y. O<u<t)) 


1 1 Si 
P'i=P'idP1ito + (1-p' Pot) 
où t est la durée de l'observation et du traitement associé. 
Ces probabilités prédites à l'instant t à partir des observations 
faites à t-t vont servir de probabilités a priori dans l'estimation 


récursive. Soit pour les probabilités a posteriori (après 
observation) (pit)i=1...n: 


I 
pi. P(y=y,.1x= 1) 


Pr — | | 
pi. PO=y 1x = 1) +(1-p). P(y=y. 1x = 0) 
s'il y a effectivement eu observation du pixel i et sinon: 


Le. I 
Pr = Pt 





C1.5c Couplage acoustique vision. 

1) Intégration de données hétérogènes. 

Nous employons une carte de traitement d'image et une 
caméra CCD et qui possède cinq degrés de liberté asservis et 
programmables : azimut , site, Zoom, iris, mise au point. Les 
données retournées par ce capteur sont la taille et la position 
des objets éventuellements détectés sur l'unique site observé. 
Nous utilisons six micros disposés en antenne dans le plan 
horizontal. La corrélation des signaux reçus par ces micros 
permettra donc une estimation de l'azimut des sources ou 
échos émetteurs, par des méthodes haute résolution 
développées par Olivier Michel (C1.4). À la détection d'un 
bruit de haut-parleur, le capteur acoustique effectue un test 
destiné à vérifier qu'un seul haut parleur émet (c'est un simple 
seuillage), et si cette condition est vérifiée, le traitement de 
localisation est lancé. 

Les problèmes à résoudre seront donc le choix de la 
configuration de la caméra (c'est-à-dire de notre fenêtre 
d'observation) et l'intégration des données acoustiques et 
visuelles susceptibles de survenir de façon asynchrone. Ainsi, 
le processus de contrôle consulte successivement l'acoustique 
et la vision, en quête de données fraîches. Il en effectue, le 
cas échéant, l'intégration bayésienne suivant la démarche 
décrite dans le chapitre de théorie. 

Cette intégration se fait en une seule étape dans le cas des 
données visuelles (plus rapides à traiter que les données 
acoustiques), alors que dans le cas de l'acoustique, elle se fait 
en plusieurs étapes, en reprenant les résultats de tous les 
traitements visuels survenus entre la mise en alerte et la fin 
du traitement acoustique. Elle permet de remettre à jour nos 
tableaux de probabilité d'activité estimant l'état courant de la 
scène, en utilisant toute l'information disponible (y compris 
des données acoustiques a priori plus anciennes que les 
données visuelles).Dans un premier temps, le traitement 
acoustique nous renseigne simplement en nous disant qu'un 
seul site est actif au moment où le calcul de la localisation 


commence. Îl convient donc de calculer la probabilité que le 


site 1 soit le seul actif, au vu du vecteur des probabilités 
(pi)i=1...n. On a 


PilIC1-p;) 
j#i 


P(i seul site actif) — 





D Pr IIC1-p;) 

k=1 j*k 
Dans un second temps, le traitement nous signale une source 
à l'azimut z. En supposant que l'erreur en azimut soit la même 
pour chaque site i d'azimut réél zi et suive une distribution 
f(Iz-zil) (gaussienne par exemple), nous déduisons pour 
chaque site : 


pCZi1)=f(1Zz-z;D 


2_P;fQz-z,D 
p(zl0)=7 


2_P; 
j#i 


Le processus met ensuite à jour ses statistiques sur les 
différents temps de traitement visuels (en fonction des 
déplacements possibles de la fenêtre d'observation, c'est-à- 
dire des mouvements de la caméra), puis détermine la 
nouvelle orientation de la caméra permettant d'espérer le plus 
grand apport d'information à la prochaine acquisition, c'est-à- 
dire susceptible de produire, après intégration, le tableau de 
probabilité le plus contrasté au sens de la minimisation de : 


Espl > min(p;.1-p.) 
3 | 


Le compromis entre temps et précision des traitements est 
implicite, puisque plus le traitement choisi est long, plus les 
probabilités du tableau sont dégradées lors de l'intégration, 
l'information gagnée sur un site étant compensée par 
l'incertitude induite sur tous ceux qui n'ont pas été visités. 
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Structure du système de perception. 


2) Gestion de données anachroniques. | 

La différence des temps de traitements entre les capteurs : 
employés pose un nouveau problème, dès lors que l'on ne 
peut plus affirmer que les résultats vont arriver dans l'ordre 
chronologique des débuts de traitement. Il n'est pas 
envisageable d'attendre et de réordonner ces données après 
que l'ensemble des traitements engagés a abouti, parce que 
rien ne nous garantit la terminaison de ce procédé (sauf à 
inhiber certains capteurs) et parce qu'il suppose que le 
système sera souvent en attente, malgré des arrivages de 
données "fraîches". Il n'est pas non plus question de laisser de 
côté les données’ arrivant en retard, ce qui reviendrait, en fait, 
à inhiber totalement le capteur le plus lent. | 

Nous avons donc choisi une démarche plus complexe qui a le 
mérite d'utiliser toutes les données à notre disposition dès 


qu'elles sont disponibles. Pour cela, le contrôleur assure la 


mise à jour d'une liste chonologique des couples (données 
datées, tableau de probabilités qui pourra en être déduit). 
Lors de l'arrivée de données anachroniques, il effectue en 


cascade l'intégration des données postérieures à ces dernières 
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données reçues, en partant du tableau de probabilités 
immédiatement antérieur à celles-ci et en remettant à jour 
toutes les probabilités de sa liste (comme l'illustre la figure ci- 
dessous). Le tableau de probabilité final, qui définira l'état 
supposé de la scène, sera alors celui associé aux données les 
plus récentes (et qui ne sont donc pas forcément les dernières 
reçues). 








+. 7 Données utilisées 
d' 5 lors de l'intégration 
3 lorsde l'intégration 


CE 





détéeé À "déduite 
DonnéesL Prat T 
datèees 2 e 


Arrivée de données anachroniques. 


C1.5d Conclusion. 


Cette manipulation a permis une validation de l'approche 
probabiliste dans un scénario de surveillance, et en a atteint 
simultanément certaines limites prévisibles. En effet, il ne 
sera pas possible de conserver cette approche pour des 
scénarios ou des tâches de perception plus complexes, parce 
que la modélisation de l'univers en termes de probabilités 
devient rapidement très difficile. Cela confirme l'idée selon 
laquelle une alternance de couches logiques et statistiques est 
nécessaire, même à bas niveau. De plus, il apparaît un seuil 
au delà duquel un environnement complet d'exécution et de 
programmation est nécessaire pour un système multicapteur 
(système d'exploitation temps réel, processeurs spécialisés 
avec des communications performantes, programmation 
orientée acteurs communiquant par messages plutôt que par 
mémoire partagée, .…). 


Dessoude O., Tonchia H., Vimont Y. 
Conception Et Réalisation D'Un Système Multicapteur. 
Rapport de stage de fin d'études ENSTA. 1988. 


C1.6 Environnement informatique multicapteur 
JL.DESNOYER((Thèse(Paris XI) C.FLUHR) 
B.Zavidovique) 
C1.6a Introduction 
Dans le cadre de l'activité multicapteurs, le laboratoire 
Système de Perception s'est attaché au cours des deux ans 
précédents à élaborer un modèle d'un dispositif de perception 
adaptatif pour le développement des robots de troisième 
génération. Une complexification des fonctions de perception 
et de décision est d'emblée nécessaire. Il se pose alors des 
problèmes de fusion multicapteurs et de contrôle du système 
de perception afin d'assurer une gestion optimale du parc 
d'opérateurs de traitements, compte tenu des contraintes 
d'accès aux ressources communes que sont les capteurs et les 
moyens de calcul. Afin d'étudier ces problèmes, deux-types 
d'algorithmes coopératifs ont été développés : 

-le premier, contrôleur logique [Voir C1.1], utilise 
un classifieur quasi-optimal afin d'adapter des requêtes de 
classification dans le contexte courant (application en analyse 
de scènes, en surveillance …). 

-le second, contrôleur stochastique [Voir C1.2], 
utilise le formalisme bayésien pour propager de manière 
optimale les résultats de nouvelles observations dans 
l'estimation de l'état courant du système (application en 
poursuite, en surveillance ….). 

Ces deux contrôleurs ont été testés en simulation sur 
machines LISP et SUN. L'étape suivante concerne le passage 
au cas réel : une manipulation probatoire, débutée en juin 
1988, permet de contrôler le système P.A.R.LS. (Perception 
Acoustico-visuelle pour Robots Intelligents de Surveillance) 
dans le cadre d'une adaptation au cas asynchrone du modèle 
stochastique [Voir C1.5]. La finalité de cette première 
expérimentation est d'assurer la - surveillance d'une scène 
composée de plusieurs sites, en parcourant ces points 
sensibles de façon stratégique, et en utilisant les ressources 
perceptives hétérogènes constituées par l'image reçue de la 
caméra et le son capté par l'antenne. C'est dans le cadre de 
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cette mise en oeuvre concrète que s'inscrivent les travaux 
mentionnés ci-après. 

C1.6b Dispositif expérimental 

La structure d'accueil du dispositif multicapteurs est organisée 
autour d'un calculateur SUN. Celui-ci est une machine 
orientée réseau (Ethernet), possédant un bus VME susceptible 
de recevoir divers développements matériels (mémoires 
d'images, traitements à la volée …) au fur et à mesure de 
l'avancement des travaux. Des cartes interfaces IEEE assurent 
les connexions aves les différents capteurs du système de 
perception ( cf schéma ). Ceux-ci sont actuellement de deux 
types. 

1) acoustique 

Le dispositif d'acquisition acoustique comporte une antenne 
linéaire composée de six microphones à électret, suivi d'une 
chaîne d'acquisition numérique. Ce dispositif est intégré à une 
machine PC-AT (Compaq) permettant le traitement des 
signaux acquis. Le traitement acoustique, basé sur des 
méthodes issues des algorithmes à "haute résolution", permet 
d'estimer le nombre de sources sonores et l'angle d'arrivée 
d'ondes planes multiples sur une antenne linéaire à n capteurs 
[Voir C1.4]. 

2) vision 

Le capteur est une caméra noir et blanc CCD de résolution 
500 * 582 pixels. Celle-ci est montée sur un support 
orientable en site et en azimut. Un balayage de + 100 degrés 
en azimut et de -72 à 49 degrés en site est assuré. L'optique 
est un objectif zoom motorisé de focales allant de 11 à 115 
mm, de mise au point minimale égale à 1,3 m et d'ouverture 
maximale égale à 1.8. La motorisation de cet objectif permet 
le contrôle des bagues de zoom, focus et iris. Contrairement 
au support orientable, l'électronique de commande associée à 
l'objectif n'existe pas. Elle a donc été développée au 
laboratoire et interfacée IEEE [Lamotte,87]. 

Dans l'attente d'acquisition de cartes de traitements d'images 
interfaçables directement au SUN (cartes DATACUBE 
compatibles VME), l'atelier utilise un dispositif de traitements 
d'images (extraction de primitives, seuillage, filtrage ….) 
incorporé dans un micro-ordinateur PC-AT (GIP/EIA). Dans 
ce cas, les communications avec la station de travail SUN se 
font par une connexion Ethernet couplée au protocole NFS. 





Dispositif expérimental 


C1.6c Commande de la caméra 

Dans le contexte de la réalisation de cette sous-fonction 
complète de perception (coopération acoustique-vision), le 
contrôle des actionneurs de configuration en fonction des 
objectifs de perception est particulièrement important. Notre 
but a donc été de fournir, au contrôleur du système, une liste 
de commandes permettant de configurer les 5 degrés de 
liberté de la caméra. Cette liste se présente sous forme d'une 
bibliothèque de fonctions écrites en langage C et appelables 
depuis la station de contrôle SUN. 

1) Commande de l'objectif 

Au début de nos travaux, seule la commande du support de la 
caméra était opérationnelle. Celle-ci obéit globalement à la 
syntaxe suivante: É 
commande axe fonction [ paramètre(s)] 


- AVEC : 





- champ "commande" <-> commande sur l'axe ou sur le 
compteur de pas associé 

- Champ "axe" <-> azimut ou site 

- Champ "fonction" <-> affectation, exécution, origine et 
interrogation 

Afin d'homogénéiser la commande du capteur à tous les 
niveaux, nous avons respecté, dans la mesure du possible, 
cette syntaxe lors du développement de la commande de 
l'objectif. Celle-ci se décompose en trois principaux modules: 
initialisation, gestion des communications et asservissements. 
La gestion des communications se fait en tâche de fond tandis 
que les asservissements se font sur interruption. 

Le module d'initialisation, appelé à la mise sous tension ou 
par action sur le bouton-poussoir "reset", permet la validation 
des interruptions, le test des timers et des moteurs ainsi que 
l'initialisation des modes de communication (ACIA /IEEE). 
Le module de gestion des communications assure le 
fonctionnement des périphériques et l'interprétation des 
commandes reçues. Il réceptionne les ordres caractère par 
caractère, en reconnaît la syntaxe et agit en conséquence : 
exécution de la commande décodée ou génération d'un 
message d'erreur. 

Le module Asservissement assure en fait non seulement les 
asservissements mais aussi les commandes des moteurs en 
mode manuel ("local"). En tournant sous interruption, ce 
mode bénéficie d'un cadencement gratuit pour scruter les 
boutons-poussoirs et actualiser les commandes des moteurs. 
Si le mode "remote" est choisi, un asservissement de type 
PID est mis en oeuvre. La correction se traduit par l'envoi de 
la vitesse V au hacheur du moteur, donnée par : 


V=CP*en + Dei 17 + Gr - €n-10) * CD 


avec CP, CI, CD: coefficients d'asservissement choisis 
expérimentalement. 

Signalons que les écarts en sont mémorisés dans une FIFO 
afin de pouvoir calculer le terme dérivée. Ce dernier est 
déterminé par soustraction de deux valeurs prises à intervalle 
de 100 ms afin que la dérivée de l'écart par rapport au temps 
soit significative. 

2) Etalonnage de l'objectif 

Lors de cette phase de calibration, nous avons mesuré 
plusieurs grandeurs physiques spécifiques à l'objectif. Pour 
chacune d'entre elles le principe de correspondance a été : 
envoi d'une position (ou d'une vitesse) codée sur l'une des 
bagues de l'objectif et mesure effective de la grandeur 
physique considérée. Ainsi la traduction entre le niveau 
actionneur et le niveau utilisateur s'établit naturellement. 


1) angles de champ / focales 

Afin de déterminer l'intervalle des angles de champ du zoom 
de la caméra, nous disposons d'un panneau de 1,2 m de large 
sur 1,7 m de haut, sur lequel nous avons fixé un système 
d'axes gradués, matérialisés par une paire de mètres-ruban. 
Ce dispositif nous permet alors de mesurer la diagonale vue 
sous l'angle de champ de la caméra, par simple lecture des 
distances graduées en X et en Y. Connaïissant cette diagonale 
et la distance capteur-panneau, nous pouvons déduire l'angle 
de champ q par les relations suivantes : É 


| Dm 
= 2  — 
0 = 20 et tgc 5D 


avec: D distance capteur-panneau égale à 1,3 m et Dm 
diagonale mesurée. D'autre part nous remarquons que la 
focale f de l'objectif peut se déduire de l'angle de champ par 
la relation suivante : 


D 
f = — * cOtgo 


avec : Ds diagonale de la surface sensible du capteur égale à 
11 mm. 

Les mesures faites sur la bague de zoom permettent de 
couvrir toute la gamme d'angles de champ (et de focales) 
admissibles par l'optique de la caméra. | 


_ li) distances de mise au point 





Les distances de mise au point ont été effectuées à l'aide d'un 
ensemble de mires et de grands caractères blancs sur fond 
noir. La bague de focus de l'objectif a été calibrée à ouverture 
et focale maximales afin de réduire au maximum la 
profondeur de champ. Les dimensions du local ne permettant 
pas des mises au point au delà de 5 mètres, nous avons eu 
recours à l'utilisation d'un miroir afin d'étendre l'intervalle des 
distances jusqu'à 9 mètres. La distance minimale de mise au 
point est de 1,3 mètre. 


li) vitesses des bagues 

Pour calibrer en vitesse les bagues de l'objectif, nous avons 
procédé de la manière suivante : 

- mesure du déplacement angulaire pour aller d'une butée de 
fin de course à l'autre. Cet angle, mesuré à l'aide d'un 
rapporteur, est approximativement égal à 110 degrés pour les 
trois bagues. ÿ 

- envoi d'une commande de vitesse et mesure du temps de 
parcours. Toutefois nous avons vérifié que, pour une valeur 
de vitesse fixée, les temps de déplacement étaient quasi- 
identiques quels que soient le sens de rotation et la bague 
considérée. 

Connaissant le déplacement et le temps de parcours, le calcul 
de la vitesse est immédiat. 

Ces mesures sont le point de départ de l'élaboration des tables 
de transcodage de 256 *256 points obtenues par 
interpolation au moyen de splines cubiques. Enfin, ce logiciel 
(commande et tables de transcodage) a été écrit en 
assembleur 68000 sur outil de développement Tektronix. Cet 
émulateur, relié au prototype, nous a permis de tester le 
logiciel sur la maquette avant d'en envisager une version en 
mémoire morte. 

C1.6d Interface contrôleur 

À ce stade des travaux, le seul moyen de communiquer avec 
le contrôleur du système est l'utilisation du logiciel-pilote de 
la carte interface IEEE du SUN. Cependant nous remarquons 
que l'utilisation de ce logiciel n'est pas sans inconvénient : 

- il n'y a pas transparence de l'adressage logique des différents 
dispositifs, vus depuis le calculateur SUN, à travers le réseau 
IEEE. Ceci oblige donc à considérer la caméra, au niveau du 
contrôleur, comme deux parties distinctes (support et objectif) 
alors que nous voulons exactement le contraire : le capteur 
doit être vu comme un objet unique avec tous ses degrés de 
liberté, adressable depuis le contrôleur sans se soucier du 
support physique de communication (nature du bus) ou de 
l'emplacement sur celui-ci. 

-il n'y a pas de possibilité d'emploi convivial de variables 
dans les commandes puisque celles-ci se font par envoi de 
chaïnes de caractères sur le bus. A chaque valeur prise par 
une variable, une conversion numérique/ascii et une 
concaténation au reste de la commande sont à prendre en 
charge au niveau du contrôleur. 

- enfin aucune information de retour sur l'état d'un des axes 
du capteur n'est fournie implicitement. 

Nous pensons alors que ces raisons justifient la présence 
d'une interface avec les logiciels haut-niveau du système. 
Celle-ci se présente sous la forme d'une bibliothèque C dont 
les fonctions sont représentatives de la commande du capteur. 
C1.6e tionne ici 

De façon idéale, la structure logicielle devrait reproduire la 
structure fonctionnelle. En pratique, les contraintes de 
l'implantation influent largement sur la structure logicielle. 
Celle-ci perd généralement en clarté et en modularité. 
Cependant nous disposons à présent d'outils relativement 
puissants et complets (systèmes d'exploitation temps-réel) qui 
permettent de représenter des structures fonctionnelles 
richement dotées. De façon à éclairer ces propos, nous allons 
présenter notre modèle d'architecture fonctionnelle dont la 
brique de base est le senseur logique, puis une réalisation qui 
en est la transposition logicielle. 

1) Architecture fonctionnelle 

La complexité d'un système multisensoriel et multitraitements 
impose une description symbolique de la machine et un 
découpage en modules précis et efficace. Les différents 
éléments constitutifs d'un tel système peuvent être séparés en 
deux catégories : les ressources perceptives et les senseurs 
logiques. 

Les ressources perceptives sont essentiellement constituées 
des capteurs, mais aussi des processeurs de traitement. En 
effet les commandes de contrôle des capteurs, telles que 
l'orientation, la mise au point ou le zoom d'une caméra, 
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déplacent sa fenêtre d'observation dans l'univers. Celle-ci, 
limitée, constitue une ressource du système perceptif au 
même titre que la gestion des ressources d'un système 
informatique. Un processeur sera également une ressource 
limitative si les traitements ne peuvent tourner en parallèle, 
cas inverse de la situation où chaque capteur dispose d'un 
processeur spécialisé. 


La notion de senseur logique exploite beaucoup de principes 
bien connus en génie logiciel, en particulier ceux 
d'abstraction et de modularité. Le senseur logique renferme : 
- un ou plusieurs senseurs logiques 

- les commandes de configuration des capteurs et traitements 
associés 

- un système d'intégration temporelle et multisensorielle 
(lorsqu'il y a plusieurs sous-traitements) 

- un système de gestion des ressources capteur et processeur 
(ordonnancement des traitements séquentiels, répartition du 
temps CPU entre traitements ….) 


On aboutit alors à un modèle hiérarchisé de description de la 

réalité analogue à ce qui se fait généralement dans les 
programmes d'analyse de scène existants, dans lesquels les 
niveaux les plus bas utilisent des traitements classiques tels 
extraction de primitives. La structure est un arbre de 
processus, les feuilles sont constituées par les processus 
capteurs proprement dits. Les connexions entre éléments de la 
structure sont établies par des canaux de données acquises et 
résultats (flot convergent) et des canaux de contrôle (flot 
diffusant). Dans cette architecture, les aspects originaux sont 
la présence d'une intégration des informations de diverses 
sources, qui permet de relâcher les contraintes de chaque 
traitement, et celle d'un contrôle de commande capteur 
permettant notamment des rebouclages locaux des résultats 
d'un traitement. 
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2) Architecture logicielle 
Actuellement la structure logicielle de ce système, nômmé 
P.A.R.ILS., se résume à un ensemble de boucles 
représentatives des trois modules du système (cf schéma) : 


1) contrôle 

La boucle de contrôle consulte successivement l'acoustique et 
la vision en quête de données fraîches. Elle en effectue 
l'intégration bayésienne, puis détermine la nouvelle 
orientation de la caméra permettant d'espérer le plus grand 
apport d'information à la prochaine acquisition. 

11) acoustique ; 

La boucle de gestion de l'acoustique tente régulièrement 
d'effectuer une synchronisation avec sa boucle de veille, afin 
de recevoir les résultats du traitement de localisation lors de 
la détection d'un bruit significatif. Sur réception de ceux-ci, 
la boucle de gestion de l'acoustique les stocke dans une 
structure spécifique et en informe la boucle de contrôle. 

li) vision 

Après avoir demandé l'acquisition d'une image, la boucle de 
gestion de la vision se met en attente de résultats de 
traitements. De façon analogue à l'acoustique, elle les range 





dans une structure spécifique et en informe la boucle de 


contrôle. 
Boucle 
de contrôle 
Boucle de 


gestion acoustique 


Boucle de 
gestion vision 


Boucle de veille 


Boucle d'acquisition 
et et 


aitement acoustique traitement vision 





Architecture logicielle 


C1.6f Conclusion et perspectives 

Une manipulation probatoire permettant de contrôler le 
système multisensoriel P.A.R.I.S., a donné lieu à 
l'élaboration d'une structure logicielle devant évoluer de façon 
à prendre en compte les véritables besoins d'environnement 
complet de développement et d'exécution d'un système 
multicapteurs : | 

- environnement exécutif temps réel avec récupération aisée 
des interruptions 

- reconfiguration dynamique souple en fonction des 
possibilités du matériel et des besoins des applications 

- service de communications performant et uniforme 

Toutes ces considérations ainsi que l'expérience acquise au 
laboratoire nous ont poussés à choisir CHORUS. Celui-ci est 
un système d'exploitation réparti construit autour d'un noyau 
temps réel qui gère les entités élémentaires du système : 

- les acteurs, machines virtuelles, définissant des espaces 
d'adressage protégés (mémoire virtuelle) 

- les activités, unités d'exécution qui puisent leurs ressources 
(code, données, contexte) dans un acteur, plusieurs activités 
pouvant partager un même acteur 

- les portes et les messages qui permettent aux activités de 
communiquer entre elles de façon transparente vis-à-vis de la 
répartition 
Notre première étape va être d'implanter la manipulation 
actuelle sous le système CHORUS. Cette implantation 
s'effectuera en considérant les relations suivantes : 

- acteur <--> module 
- activités <--> boucles locales 
- messages <--> moyen de communication 
Ainsi tout programme du système P.A.R.LS. sera considéré 
comme un monde d'entités autonomes interagissant 
mutuellement au moyen de messages. 

Enfin nous prévoyons, dans une étape ultérieure, l'ajout de 
figures géométriques dans le scénario afin de pouvoir lancer 
une classification (discrimination sur les formes 2D) sur la 
cible supposée avoir une taille suffisante sur l'image. 
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C1.7 Contrôle naturel 

V.GOURET(Thèse(Paris X1)B.Zavidovique) 

C1.7a Le contrôle naturel: pourquoi ? 

Dans tout problème de contrôle de processus, il est nécessaire 
de préciser rigoureusement les points suivants: 

1) quel est le système auquel on s'intéresse ? 

1) quels sont les échanges entre ce système et le reste de 
l'univers ? 

ii) quel est le but poursuivi (but du contrôle)? 

iv) quelles sont les entrées, les sorties (classification souvent 
arbitraire des objets référencés dans ii) } ? 

v) quel est le comportement du système ? 

Un système est toute portion de l'univers isolée arbi- 
trairement, définissant ainsi des échanges entre elle-même et 
le reste de l'univers. Bien évidemment, il est nécessaire 


d'effectuer un choix dans ces échanges et d'en négliger 
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certains, c'est la réduction du réel. Les mathématiques 
interviennent naturellement pour modéliser les échanges. 
Pour obtenir de tels modèles, deux démarches sont possibles: 
soit la structure interne au système est connue, auquel cas les 
lois classiques de la physique donnent généralement une 
forme implicite de la relation entrées/sorties qu'il ne reste plus 
qu'à quantifier (identification des paramètres physiques), soit 
le système est une sorte de boîte noire impénétrable auquel 
cas il faut présumer une structure de modèle et l'identifier sur 
la base de données issue d'essais réels sur le système, on 
obtient alors un modèle de comportement. 
Reste le but, qui doit être alors exprimé sous forme 
mathématique. La résolution du problème de contrôle devient 
du même coup un problème de mathématiques. 
Malheureusement, ces démarches ne sont pas toujours licites 
ou bien engendrent une représentation du problème de 
contrôle tellement complexe que sa résolution théorique est 
hors de portée. Plus grave, il existe des systèmes que l'on 
peut qualifier d' anthropomorphiques qui ne peuvent admettre 
de modélisations classiques correctes ou de mathématisation 
du but. Par contre, certains de ces systèmes possèdent des 
contrôleurs efficaces en la personne d'un humain (ex: voiture 
et son pilote). Ici interviennent les outils de l'IA: c'est le 
contrôle naturel. 
C1.7b IA et contrôle 
De nombreux auteurs ont déja disserté sur l'TIA dans le 
contrôle et réciproquement, introduisant la notion de contrôle 
hiérarchisé à trois nivaux, l'un très proche du processus 
utilisant des contrôleurs issus d'une étude quantitative du 
processus, un autre dit de coordination faisant appel à des 
algorithmes adaptatifs, enfin un dernier dit d'organisation où 
des techniques d'TA interviennent. Le mécanisme préconisé 
est l'utilisation de bibliothèques d'algorithmes de contrôle. Le 
but est de séparer les connaissances spécifiques au domaine 
de celles du contrôle. L'utilisation de l'TA passe donc par une 
hiérarchisation du contrôle (fragmentation du problème 
global) et aboutit à une structure hétérogène du contrôleur. Le 
contrôle naturel voit l'IA comme un outil d'homogénéisation, 
en descendant aux plus bas niveaux. De plus, le contrôle 
naturel, de par sa nature, s'étend facilement à la notion 
d'apprentissage, mais ce n'est pas sa motivation essentielle. 
C1.7c Contrôle naturel: comment ? 
L'idée de base du contrôle naturel est la possibilité d'exploiter 
des connaissances qualitatives sur le système à contrôler. 
Cette idée est issue de l'étude du robot de découpe de 
matériaux utilisant un laser de puissance (cf rapport 85/86). 
L'absence de modèle d'interaction laser-matière dans la 
gamme de puissances utilisées et cependant l'existence d'un 
savoir faire en matière de contrôle de la découpe détenu par 
des techniciens spécialisés a induit une approche 
anthropomorphe du contrôle. 
L'expression de ce savoir-faire mobilise couramment des 
affirmations ayant la syntaxe suivante: 

SI A ALORS B 
induisant une relation logique ou sémantique entre les objets 
A et B qui peuvent être très divers. 
La manipulation de telles structures demande l'utilisation d'un 
support informatique pour le contrôleur, d'autant plus que le 
contrôle naturel vient d'un souci d'homogénéisation de 
l'écriture des contrôleurs et que sa méthodologie repose sur un 
balancement perpétuel entre essais, analyse et correction du 
contrôleur en construction, ceci demandant donc un moyen 
rapide, sûr et convivial d'écriture. M. Le Goc et L. Foulloy 
ont proposé un langage spécifique à l'écriture et à la 
manipulation des règles permettant ainsi la conception de 
contrôleurs indépendamment de la machine sous-jacente. 
C1.7d Syntaxe des règles 
La démarche habituelle lors d'un problème de contrôle passe 
par l'expression de relations entre entrées et sorties du 
système ainsi que les relations que doivent vérifier les sorties 
contraintes. Par exemple, par suite d'une modélisation 
mathématique d'un système, on peut être amené à écrire la 
relation reliant sorties et entrées (ex: séries de Volterra) du 
type: y = f(u,t). 
Cette écriture peut être explicite ou implicite. Pour les règles 
de comportement, cette écriture devient: 
SI (commande) ALORS (observation) 
où (commande) est toute proposition logique portant sur la 
commiande (qui peut être vectorielle) du processus et 
(observation) l'analogue sur la sortie. 


Les relations que doivent vérifier les sorties contraintes sont 
de natures multiples. Par exemple, si on se pose le problème 
de la poursuite d'une trajectoire yd, on peut prendre comme 
indice de satisfaction un écart quadratique sur un horizon 
donné: 


2 
s= fo) 


(de telles expressions sont largement utilisées en théorie 
mathématique de la commande optimale). 
En contrôle naturel, on aura des règles du genre: 

SI (observation) ALORS (satisfaction) 
Enfin, l'expression du contrôle (en boucle fermée) du 
processus utilise des règles du type: 
SI (observation , satisfaction) ALORS (commande). 
L'obtention de telles règles de contrôle se fait par une sorte 
d'inversion logique des règles de comportement (qui 
représente d'une certaine manière le modèle retenu du pro- 
cessus) et de celles exprimant la satisfaction, ceci en accord 
avec le but fixé. 
L'écriture des règles telle qu'elle est présentée précédemment 
n'est cependant pas complète, en effet, il s'avère utile de 
permettre une extension de la syntaxe à des objets du type: 
SI À ALORS B, C. 
où C désigne un argument de la règle. Le contenu de cet 
argument peut être de nature diverse. On peut par exemple 
affecter à chaque règle un poids qui symbolise 
(numériquement ou non) la confiance à lui accorder, ce poids 
pouvant être dynamique auquel cas son évolution sera elle- 
même générée à partir d'autres règles. Un autre exemple 
d'argument nous est fourni par M. Le Goc et L. Foulloy dans 
l'écriture d'un contrôleur de moteur de bras de robot: 
l'argument permet d'injecter la notion de prédiction du 
comportement du système, l'écart entre le comportement 
attendu et l'effectif entraînant une correction de variables 
internes au contrôleur (notion de comparateur de modèles 
comportementaux). 
C1.7e Démarche et exemple. 
Le premier stade dans la résolution d'un problème de contrôle 
par des règles est d'appréhender le comportement qualitatif du 
système étudié. Pour cela, un travail expérimental est 
nécessaire, afin d'obtenir des données souvent numériques sur 
ce comportement. Une autre possibilité est d'exploiter 


directement une connaissance experte sur le processus connu 


par un humain, comme dans le cas du laser de puissance en 
découpe. Le problème qui suit est d'énoncer des lois 
qualitatives à partir de ces données ou de cette connaissance 
souvent difficilement exprimable même par son possesseur. 
La recherche de tels énoncés est guidée par la recherche de 
régularités comportementales du système, exprimées grâce à 
un langage réduit. Un exemple d'un tel langage et d'un 
énoncé est: si x est croissant alors y croît puis décroît. 

Le langage utilise les termes "croît", "décroît", "est 
décroissant", “est croissant", x et y symbolisant les échanges 
du système avec son exosystème. L'écriture de telles règles 
est formellement équivalent aux écritures de propositions 
logiques du type: Fx ..… Gy. La suite de l'étude consiste à 
inverser ces énoncés afin d'exprimer des lois de contrôle. 
Supposons que l'on ait obtenu les énoncés suivants: 

(1) Fx .… Gy, (2) Hx … Gy, (3) Ax .… Gy et que quel que 
soit y l'un de ces énoncés soit valide, alors la loi de contrôle 
pourra s'exprimer par: Gy .… Fx v Hx v Ax. | 

Reste l'énoncé du but poursuivi. Deux voies différentes sont 
possibles, soit par la structuration même des règles de 
contrôle (ex: contrôle du laser), soit par des règles. 

Pour illustrer cette démarche, nous avons étudié la commande 
d'une machine à courant continu en vitesse. La perturbation 
s'injecte au niveau du couple résistif. Pour respecter du mieux 
possible l'approche du contrôle par règles de comportement, 
il a fallu jouer au candide face au système. 

La connaissance de départ est la suivante: 

- on sait que le moteur accélère quand la tension 
d'alimentation croît (et si la tension s'inverse, la vitesse 
s'inverse). 

- on sait que la tension d'alimentation du moteur est 


bornée en valeur absolue (pour éviter de détruire le moteur). 


- on veut maintenir le moteur à une certaine vitesse 


- No (quoi qu'il arrive, ceci étant l'énoncé d'un but idéal). 


Le premier contrôleur considéré est extrêmement simple: il 
consiste à commuter la tension d'alimentation entre ses deux 
extrêmes en fonction du signe de l'écart. 
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Cette idée est en effet assez naturelle si on s'étaie sur des 
notions de physique élémentaire: la vitesse du moteur ne peut 
pas présenter de discontinuités. Si on fait parcourir "de long 
en large” la tension d'entrée toute sa gamme de variation, la 
vitesse doit passer par la vitesse désirée, sinon on en conclut 
qu'on est incapable avec les bornes sur la tension de 
commande d'atteindre le but désiré. La règle est donc: 

Si No>N alors u= Umax; 

Si No<N alors u= Umin. 

(ici, le langage n'est pas de type naturel pour des problèmes 
d'implantation). 

Pour une période d'échantillonnage (Te) de 0,1s, la vitesse ne 
converge pas vers No, elle oscille autour de cette valeur avec 
une période d'environ 2s et un taux d'ondulation de 37,5%, ce 
qui est très mauvais. Pour 0,01s, on n'obtient pas de 
convergence asymptotique mais l'oscillation diminue en 
amplitude (<5%), le temps de réponse à un échelon de vitesse 
étant de 9s (temps à partir duquel la vitesse reste comprise 
entre 0,95No et 1,05No, classique en automatique). Pour 
0,001s, c'est encore mieux: ondulation inférieure à 2% et 
temps de réponse de 6,4s (le temps de réponse moteur seul 
est de 7,6s environ). 

Pour une telle classe de contrôleurs, les conclusions sont donc 
les suivantes: plus Te diminue meilleurs sont les résultats. 
Cependant, quelle que soit Te, l'erreur ne converge pas vers 


Le deuxième contrôleur possible pourrait être d'utiliser une 
variation de la tension u plus graduelle. L'idée en est qu'à une 
vitesse désirée pour la machine correspond une tension que 
l'on cherche donc à approcher par ce moyen. Les règles du 
genre: 
Si No>N alors u=u+pas; 
Si No<N alors u=u-pas 
sont cependant insuffisantes, elles fournissent des résultats 
encore moins bons que le contrôle en commutation précédent 
(une explication de ce phénomène est fournie par le 
raisonnement suivant: l'incrémentation agit comme une sorte 
d'intégration placée avant le moteur, d'où un effet 
déstabilisant, de plus les commandes qui sont ainsi 
synthétisées sont “affines" par morceaux, la croissance étant 
fixée par le pas d'incrémentation, et la dynamique du 
contrôleur s'en trouve ainsi diminuée). 
Une amélioration du contrôleur “bang-bang échantillonné" 
peut se déduire des remarques précédentes concernant le 
comportement des deux premiers contrôleurs. On peut 
remarquer que la commande générée par le contrôleur "bang- 
bang” présente une disymétrie entre les deux butées qui va en 
s'accentuant quand la consigne augmente. On peut donc 
penser trouver là une information concernant la tension que 
cherche à approcher le deuxième contrôleur. Il faut donc 
effectuer une sorte d'"hybridation" des deux contrôleurs 
précédents. L'idée la plus simple est d'injecter au moteur 
toutes les deux commutations la valeur moyenne de la tension 
en superposition de la commande en commutation qui est 
alors recentrée autour de cette valeur moyenne pour éviter le 
dépassement de la tension maximale. L'algorithme utilisé est 
le suivant: 

initialisation (umoy=0) 
bou:: delta-min(Umax-umoy,umoy-Umin) 

si No-N>0 alors: ul= delta - 

si No-N<0 alors: ul= -delta 
u=umoy+ul | 

si deux commutations | 

alors umoy=(moyenne_de_u) 
retour en bou:: 

Les courbes des réponses du moteur muni de ce contrôleur 
montrent qu'effectivement on aboutit à une symétrisation de 
la partie "bang-bang", une amélioration de la réponse à un 
échelon, une bonne poursuite à une consigne en rampe mais 
un défaut subsiste: si delta n'est pas assez grand et qu'il ya un 
changement de tendance pour la consigne, le moteur ne 
rattrappe plus cette consigne et stagne à la vitesse 
correspondant à la tension Um+/- delta. On peut y remédier 
en détectant un changement de signe de la dérivée de la 
consigne, et en réinitialisant alors Um à 0 et delta à la pleine 
échelle de commande. 
Afin de posséder un point de comparaison permettant de juger 
cette approche avec celle plus classique de l'automatique, on 
procéde au réglage d'un PID classique par la méthode de 
l'auto-tuner de Astrom (mise en oscillation par retour par 
relais, calcul des périodes et gain critiques et réglage par les 
formules de Ziegler-Nichols du PID). Le système obtenu en 
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boucle fermée est visiblement trop peu amorti, son temps de 
réponse étant catastrophique. On n'a pas ici tenu compte des 
saturations (inévitables avec un tel système) du dispositif réel 
de commande. 

On voit donc ici que pour aussi belles que soient les théories 
utilisées en synthèse de contrôleurs par l'automatique, elles ne 
fournissent pas toujours le résultat espéré, demandant alors au 
praticien une retouche des résultats théoriques. Le contrôle 
naturel d'emblée propose cette démarche expérimentale. 
C1.7f Conclusion, perspectives. 

Le contrôle naturel se veut avant tout un outil nouveau en 
matière de contrôle de processus; il ne doit pas être ressenti 
comme une négation de l'automatique usuelle. Malgré les 
quelques résultats positifs du contrôle naturel, son défaut 
actuel est de ne pas encore présenter de cadre théorique pour 
s'exprimer. Il semble actuellement que la logique formelle 
puisse intervenir dans cette recherche. Le dispositif 
expérimental de découpe par laser de puissance offre un 
exemple toujours à l'étude de l'application de ces méthodes, 
une démarche utilisant le programme CANDIDE de Bernard 
Burg étant actuellement envisagée pour tester l'apprentissage 
automatique sur un dispositif concret. 


C1.8 Apprentissage: Application à la conduite d'une 
voiture 

B.BURG (Thèse(Paris XI)B.ZAVIDOVIQUE) 

Le contrôle naturel utilise des techniques d'intelligence 
artificielle pour écrire un contrôleur sous la forme de règles 
de comportement dont la forme générique est: "si observation 
alors commande avec poids ”. | 

Le problème d'apprentissage peut être défini comme suit: 
partant d'une grande base de données d'essai, il extrait des 
règles de comportement. Ces dernières sont des expressions 
de haut niveau. Elles observent le système, identifient l'état 
courant et envoient une commande destinée à augmenter la 
satisfaction du système. Ici, nous avons un système inconnu 
à contrôler où les seules informations accessibles sont les 
commandes et les observations. On agit sur le système, 
d'abord au hasard, puis de plus en plus intentionnellement, 
pour voir comment il réagit. Une première partie du problème 
d'apprentissage est d'observer le système après un temps 
donné et de déterminer les points d'équilibre ou les états 
accessibles du système. Une deuxième partie est alors dédiée 
à la dynamique du processus. Une perturbation est envoyée 
au système et les variations des paramètres sont mesurées. Le 
but du programme d'apprentissage est d'étudier ces variations 
et de découvrir les relations entre les paramètres du système 
et de les modéliser. Le programme d'apprentissage 
CANDIDE génère des règles de comportement; les 
commandes présentes dans les règles de comportement ont la 
forme suivante: augmente-param, décrémente-param. 


Une première étude concernant le contrôle de la vitesse d'un 
moteur à courant continu a donné des résultats intéressants. 
Notre but est d'utiliser le contrôle naturel dans un domaine 
mal modélisé. La conduite d'une voiture semble être un 
exemple intéressant parce qu'il est difficile de modéliser une 
voiture, surtout en incluant à la dynamique, les paramètres de 
glissement et de vision extéroceptive. 


La modélisation de la voiture prend de nombreux paramètres 
en compte, des paramètres géométriques( longueur, hauteur, 
largeur des roues), des propriétés d'inertie( position du centre 
de gravité, masse, moments d'inertie.), différents modes de 
transmission( traction, propulsion, transmission intégrale), 
des données aérodynamiques comme le Scx... On peut 
choisir le type de voiture( Peugeot T16, Ferrari GTO, 
Porsche 959...), les conditions atmosphériques( sec, pluie, 
neige, verglas...), ainsi que le circuit. La simulation dans sa 
configuration manuelle permet de conduire la voiture par 
l'intermédiaire de la souris, en réglant l'accélération par un 
mouvement vertical et le volant par un mouvement 
horizontal. Dans une des fenêtres, on peut faire afficher les 
paramètres désirés. On a, par exemple, à sa disposition 
l'angle de la voiture, sa vitesse angulaire et le moment. 


Le contrôle naturel mis en place actuellement n'utilise que 
deux paramètres d'observation pour contrôler la voiture. Ce 
sont respectivement la position latérale sur la route et l'angle 
relatif. Cette observation du système est clairement restrictive 
et ne donne qu'une prédiction très approximative de la route. 


- La performance du programme devrait donc pour l'instant être 





de loin moins bonne que celle d'un utilisateur humain. 
Cependant, ces restrictions ont suffit pour poser le problème 
d'apprentissage, trouver une méthode adéquate et implanter 
des algorithmes. Une fois ces buts atteints, il sera possible 
ultérieurement de passer à des paramètres d'observation plus 
sophistiqués et donc d'avoir des contrôleurs beaucoup plus 
performants. 


Une base de données d'essai est créée dans laquelle sont 
regroupées les évolutions dynamiques discrètes du processus 
à contrôler en présence d'une entrée rampe ou d'une entrée 
échelon. Plusieurs essais sont faits sur chaque commande 
avec des conditions initiales différentes, le but étant de 
générer toutes les situations possibles avec les paramètres 
d'observation et de commande du système. 

Par exemple, des essais ont été faits avec une vitesse initiale 
donnée et une fonction échelon aléatoire pour la position du 
volant. On enregistre alors les évolutions de tous les 
paramètres comme la fréquence d'échantillonnage, le temps, 
la vitesse, l'accélération, les forces et la mesure de 
satisfaction. Ces bases de données d'essai sont ensuite 
dérivées par rapport au temps afin d'exprimer les données 
qualitatives à l'aide de l'alphabet suivant: une flèche vers le 
haut pour croissant, une flèche vers le bas pour décroissant et 

0 pour constant. 

Ensuite, tous les paramètres peuvent être modélisés, leurs 
variations sont étudiées et recombinées pour interprétation. 


Un essai est une liste de symboles de la forme (nom essail 
essai2 .….). Voici un exemple de session: 


(PUISSANCE (000000000000)(000 
00)(0000000000) ((000000)(000 
(000000)(0000000000)(000000) 

0 


(ANGLE (000000000000 
(0000000000) (00000 
000)(0000000000)(00 0 
(VITESSE (TTTTTITITITLOAT Th 
D DORE ETE TE DETTE TNT 
TTL PETIHATITINDATITILTITIN 
CÉTETÉ DAT ETTUS 


(ACCELERATION (TITITITITITIDOLLL 
LUE LE DO TITETETID didLIit 
HOTEL PETILTIMALILIDETATIT 
LIL DST EL D GLLiT 


(GLISSEMENT (TITITITITIT)(000000) 
(00000O(!TTITITITI) ooooooTiT 


LTITITDO0000HTITITITITL(EO0O 
0000) (000000) 


Afin de voir les fonctions rencontrées lors de ces essais, un 
algorithme d'inférence est utilisé. C'est l'algorithme uvkw qui 
a été retenu, car il tient compte des répétitions et donne donc 
une allure générale et qualitative de la fonction. Voici à titre 
d'exemple la suite de la session avec les données précédentes: 


(PUISSANCE (0 +)) 
(ANGLE (0 +)) 


(VITESSE ((((T +) ) +) + (T5 _D+H_(T+)+c 
+)))) 


(ACCELERATION (((T _ (CL +) 7) +) _ (+) + (CL +) 
T)+#)+(L +#))) 


(GLISSEMENT (((È _ (CT _ L)+)) _ T + (((T _ L) +) + (0 
+)))) 


où + et _ signifient respectivement répétition et 
concaténation. 


VFO AUT1))) 


Le même travail est fait sur tous les paramètres. On génère 
ensuite les automates permettant de reconnaître les 
expressions régulières déduites par inférence; avec ces 
automates, il va être possible au cours de la phase 
d'interprétation de regrouper les exemples cohérents. La 
syntaxe de l'exemple qui suit est: 

(nom ((automatel) T nil T nil T}) ((automate2) nil nil nil T 
nil) ((automate3) nil T nil nil nil)) où T correspond aux 
échantillons acceptés par l'expression régulière et nil signifie 
qu'ils n'ont pas été acceptés. 


(PUISSANCE (0 +)) 
(ANGLE (0 +)) 


(VITESSE ((((T +) _ L) +) T NIL NIL NIL NIL NIL NIL 
NIL NIL NIL) 


(CGT +) LL) + (T +)) NIL NIL NILT NILT NIL 
T NIL NIL) 


(CT + NILTT NILT NILT NILTT) 


(ACCELERATION (((T _ (((L +) _T) +) _ (L +) T NIL 
NIL NIL NIL NIL NIL NIL NIL NIL) 


(QG +) _T) +) NIL NIL NILT NILT NILT NIL 
(( +) NILTT NILT NILT NILTT) 


(GLISSEMENT (((È _((T _L)+))_T)T NIL NIL NIL NIL 
NIL NIL NIL NIL NIL) 


(((T _L)+) NIL NIL NILT NILT NILT NIL NIL) 
((0 +) NIL TT NILT NILT NILT T) 


Notre but est à présent d'extraire les tendances d'évolution 
reliant deux paramètres; c'est la démarche intuitive. 
CANDIDE crée un modèle décrivant le système en termes de 
proportionnalité, de dérivation, d'intégration et de 
terminaison. 

La proportionnalité, la dérivation et l'intégration sont 
couramment utilisées en contrôle de systèmes; la notion de 
terminaison revient à s'occuper des extrema atteints par les 
fonctions étudiées. Pour chaque paramètre étudié, on dispose 
des descripteurs suivants: 

- l'automate décrivant le comportement dynamique pour 
chaque essai 

- les conditions expérimentales de chaque essai 

- la valeur finale obtenue pour chaque essai. 

En étudiant ces paramètres, plusieurs cas peuvent apparaître: 

- Si tous les essais montrent le même comportement 
dynamique quelles que soient les conditions initiales, cela 
signifie que le paramètre en question présente une sensibilité 
faible à la commande opérée. Si, de plus, l'étude des relations 
dynamiques correspond à une croissance, le programme 
d'apprentissage en déduit une relation d'intégration entre le 
paramètre et la commande. 

- quand les essais montrent des comportements dynamiques 
différents, CANDIDE étudie le comportement dynamique en 
relation avec les valeurs finales et les valeurs des 
commandes. Pour cela il utilise des techniques 


d'apprentissage extrayant des concepts dans les exemples 
(Michalski). 


(UNIVOQUES ([0+] [T+] [T+] [T+]) 
((((CO +) _ (T +)) _ (0 +)) T NIL NIL NIL) 


(((O +) _ (T +) _L) _ (0 +)) NILTTT)) 
(ANGLE VALEUR-SATISFACTION 
DISTANCE-PARCOURUE TEMPS)) 
MULTIVOQUES 


((ŒL+1 CT +1) 
(((CVIT ESSEO0) (VF0) (AUT1)) ((VITESSEO 


(((VITESSE4 VITESSE3 VITESSE2 


VITESSE1) (VF4 VF3) (AUT2)) 


(VITESSE4 VF3 AUT2) (VITESSE2 VF4 
AUT2) (VITESSE1 VF4 AUT2) 
| (VITESSE1 VF4 AUT2) (VITESSE3 VF4 


AUT2) (VITESSE2 VF4 AUT2) 
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(VITESSEZ2 VF4 AUT2) (VITESSE1 VF4 
AUT2) (VITESSE3 VF4 AUT2))))) 


(LL +107 +11+) ET +12 CEE +317 +114] 


[+171 +1) 
(((ACCELERATION3 ACCELERATION2 
ACCELERATION1 ACCELERATIONO) (VF2 VFO) 
(AUT3 AUT1)) 
((ACCELERATIONO VFO AUT3) 
(ACCELERATION?2 VF2 AUT3) 
(ACCÉLERATION1 VF2 AUT3) 
(ACCELERATION3 VF2 AUT1))) 
(((ACCELERATION4 ACCELERATION3 
ACCELERATION2 ACCELERATION1) (VF4) (AUT2) 
((ACCELERATION4 VF4 AUT2) 
(ACCELERATION?2 VF4 AUT2) 
| (ACCÉLERATION1 VF4 AUT2) 
(ACCELERATION1 VF4 AUT2) 
(ACCÉLERATION3 VF4 AUT2) 
(ACCELERATION?2 VF4 AUT2))))) 


Dans la session ci-dessus, il apparaît que les données ont 
été regroupées en diverses classes. Ensuite, ces classes sont 
examinées et on en extrait certaines relations: 


((QEL+] LT +1) 
((((WITESSEO) (VFO) (AUT1)) ((VITESSEO VFO AUT1))) 
((WITESSEA VITESSE3 VITESSE2 VITESSE1) (VF4 VF3) 


(AUT2)) 
((VITESSE4 VF3 AUT2) (VITESSE2 VF4 AUT2) 
(VITESSE1 VF4 AUT2) 

(VITESSE1 VF4 AUT2) (VITESSE3 VF4 
AUT2) (VITESSE2 VF4 AUT2) 

(VITESSE2 VF4 AUT2) (VITESSE1 VF4 
AUT2) (VITESSE3 VF4 AUT2))))) 


((vitesse0)(vf0)(aut1)) signifie que pour une position faible de 
l'accélérateur vitesseO , on a une valeur finale vfÜ faible et un 
automate décroissant autl ; ((vitesse4 vitesse3 vitesse2 
vitesse l )(vf4 vf3)(aut2)) signifie que pour une position élevée 
de l'accélérateur, on a une valeur finale de la vitesse élevée et 
un automate croissant. [Il y a donc une forte présomption sur 
le fait que la vitesse est une dérivée de la position de 
l'accélérateur. 


On dispose alors de relations entre les paramètres de 
commande et d'observation. Un système formel généralise ces 
résultats à tous les paramètres et en déduit toutes les relations 
entre chaque paramètre. 


((INTEGRALE ANGLE VALEUR-SATISFACTION 0) 
(INTEGRALE ANGLE DISTANCE-PARCOURUE 0) 
(INTEGRALE ANGLE TEMPS 0) 
(PROPORTIONNEL ANGLE VARIABLE VALEUR- 
SATISFACTION DISTANCE-PARCOURUE TEMPS) 
(PROPORTIONNEL ANGLE VARIABLE 
ACCELERATION FORCE) (DERIVEE NEGATIVE 
ANGLE VITESSE 4) | 
dE POSITIVE ANGLE VISION-POS-VOITURE 
(BORNES VISION-POS-VOITURE ((-6.158 [L+]) (7.175 


[L+1_[T+]1)) 0) 
ARE POSITIVE ANGLE VISION-ANG-VOITURE 


. ((NTEGRALE PUISSANCE VALEUR-SATISFACTION 
0) (NTEGRALE PUISSANCE DISTANCE-PARCOURUE 
(INTEGRALE PUISSANCE TEMPS 0) 
(PROPORTIONNEL PUISSANCE VARIABLE VALEUR- 

SATISFACTION DISTANCE-PARCOURUE) 

(PROPORTIONNEL PUISSANCE VARIABLE 

ACCELERATION FORCE) 

(DERIVEE POSITIVE PUISSANCE VITESSE 0) 
(DERIVEE POSITIVE PUISSANCE VISION-POS- 

VOITURE 4) 

(BORNES VISION-POS-VOITURE ((6.9159994 


+107) (-6.231 [L+p)) 0) 


(DERIVEE POSITIVE PUISSANCE VISION-ANG- 


VOITURE 4)) 
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((NTEGRALE ANGLE VALEUR-SATISFACTION 0) 
(INTEGRALE ANGLE DISTANCE-PARCOURUE 0) | 

(INTEGRALE ANGLE TEMPS 0) (PROPORTIONNEL 
ANGLE VARIABLE ACCELERATION FORCE) 

(PROPORTIONNEL ANGLE VARIABLE VITESSE 

VALEUR-SATISFACTION DISTANCE-PARCOURUE 
TEMPS) 

(DERIVEE POSITIVE ANGLE VISION-ANG-VOITURE 
4)) 


(ANTEGRALE PUISSANCE TEMPS 0) 
(PROPORTIONNEL PUISSANCE VARIABLE VITESSE 
VALEUR-SATISFACTION DISTANCE-PARCOURUE) 
(DERIVEE POSITIVE PUISSANCE PUISSANCE 3) 
(DERIVEE POSITIVE PUISSANCE ACCELERATION 2) 
(BORNES ACCELERATION (((PUISSANCE 77.25) 0.0) 
((PUISSANCE 309.0) 4.441)) 0) 
(DERIVEE POSITIVE PUISSANCE GLISSEMENT 2) 
(DERIVEE POSITIVE PUISSANCE FORCE 3) 
(BORNES FORCE (((PUISSANCE 77.25) 0.0) 
(PUISSANCE 309.0) 4263.503)) 0))) 


L'algorithme de génération des règles utilise un mécanisme 
très simple. Il cherche à maintenir le système aussi loin que 
possible des extrema pour éviter la saturation ou l'échec. 


; enonce des regles en clair 


, regle PUI-ACC+ : si ACCELERATION <« 1.99845 
alors augmenter-PUISS ANCE poids 7 

regle PUTI-ACC- : si ACCELERATION > 2.44255 
alors diminuer-PUISS ANCE poids 7 


: regle PUI-FOR+ : si 
augmenter-PUISS ANCE poids 7 
" regle PUI-FOR:- : si 
diminuer-PUISSANCE poids 7 


; regle ANG-VIS+ : si VISION-POS-VOITURE « - 
0.3148502 alors augmenter-ANGLE poids 8 

: regle ANG-VIS- : si VISION-POS-VOITURE > 
0.9998497 alors diminuer-ANGLE poids 8 


FORCE < 1918.5763 alors 
FORCE > 2344.9265 alors 


= regles sous forme utilisable par la voiture 


(SETQ REGLES 
((@UI-ACC+ (< (LIT-PARAM 'ACCELERATION) 
1.99845) (AUGMENTER-PUISSANCE) 7) 
(PUI-ACC- (> (LIT-PARAM 'ACCELERATION) 
2.44255) (DIMINUER-PUISSANCE) 7) 
(PUI-FOR+ (< (LIT-PARAM ‘FORCE) 1918.5763) 
(AUGMENTER-PUISSANCE) 7) 
(PUI-FOR- (> (LIT-PARAM FORCE) 2344.9265) 
(DIMINUER-PUISSANCE) 7) 
(ANG-VIS+ (< (LIT-PARAM ‘VISION-POS- 
VOITURE) -0.3148502) (AUGMENTER-ANGLE) 8) 
(ANG-VIS- (> (LIT-PARAM ‘'VISION-POS- 
VOITURE) 0.9998497) (DIMINUER-ANGLE) 8))) 


Dans les figures suivantes, on compare les règles obtenues 
par CANDIDE(figure en bas) avec des règles très simples 
écrites par un expert humain(figure du dessus); l'expert 
maintient la vitesse à environ 20m/s et tourne le volant selon 
la position et l'angle de la voiture. Des effets secondaires 
apparaissent comme le glissement si bien que le système perd 
rapidement le contrôle. Les règles déduites par CANDIDE 
sont basées sur l'accélération et la force transmise par la 
route. Le principe de direction reste approximativement le 
même; la voiture reste plus longtemps sur la route car elle ne 
glisse pas. Elle sort de la route car elle n'a pour l'instant 
aucune perception de la route future et ne peut donc pas se 
préparer par exemple à un virage; le développement de règles 
qualitatives est en cours: ses premiers résultats témoignent 
d'une nette amélioration puisque CANDIDE bouclant sur ses 
propres résultats (1.e. la bdde engendrée par les essais 
contrôlés par sa première production) a engendré un 
contrôleur qui cette fois bouclait plus d'un tour de circuit. 
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Apprentissage de règles de comportement. (Thèse Paris XI) 


C1.9 Grammaires régulières et inférence grammaticale 
D.LUZEAUX ((DEA(Paris VID)B.BURG) BZavidovique) 
En reconnaissance des formes, il est apparu intéressant de 
modéliser les structures par des grammaires, qu'elles soient 
régulières, context-free ou beaucoup plus générales, bien que 
ces dernières soient difficilement traitables par des moyens 
informatiques classiques. | 

Dans le cas présent, il s'agit de travailler sur des bases de 
données de taille assez importante, qu'il va falloir modéliser 
afin d'en extraire l'information nécessaire, sachant que ces 
bases de données sont des clichés à des instants donnés d'un 
processus complexe, et que le résultat des calculs doit être 
utilisable par le programme d'apprentissage CANDIDE [Voir 
C1.9]. 

Le cas des grammaires régulières a été retenu comme 
fournissant une représentation de la base de données 
exploitable, car les processus sur lesquels le programme 
d'apprentissage travaille sont des processus se déroulant dans 
le temps, ce qui privilégie dans l'espace de représentation une 
dimension, à savoir le temps; or les problèmes 
monodimensionnels sont très bien appréhendés par des 
grammaires régulières. 

Il a fallu dans un premier temps implanter une bibliothèque 
de programmes basés sur l'équivalence des grammaires 
régulières et des automates finis, ces derniers étant facilement 
implantables dans des langages de type Lisp; ainsi, 
maintenant, des programmes de traduction de grammaires 
régulières en automates finis et réciproquement, sont 
disponibles dans un environnement LeLisp sur la machine 
Sun. Une fois une grammaire générée, ainsi que sa 
représentation sous forme d'automate, il est intéressant de 
voir si une chaîne donnée est reconnue, et si elle ne l'est pas, 
à quelle condition elle peut l'être. 

À ces fins, une distance entre chaînes a été introduite, ainsi 
qu'un algorithme permettant de faire de la reconnaissance 
tolérante, 1.e. permettant à partir d'une grammaire donnée de 
générer une autre grammaire acceptant un certain nombre 


* d'erreurs. 


Cependant, cette modélisation par des grammaires présente 
un inconvénient a priori: c'est une modélisation continue, 
dans la mesure où une grammaire est en principe une union 
infinie de chaînes de caractères. Dans une base de données, 
on ne dispose que de données discrètes, desquelles il faut 
tirer une information suffisante pour appliquer les méthodes 
précédemment évoquées, sans trahir outre mesure 
l'information contenue dans les données discrètes; c'est le 
problème de l'inférence: extraire d'un nombre fini 
d'échantillons une sémantique cohérente et fidèle. 

Pour cela, plusieurs algorithmes ont été implantés et leurs 
performances ont été mesurées; une de ces méthodes a été 
retenue principalement pour le programme d'apprentissage, 
même si elle n'est pas totalement satisfaisante, surtont en ce 
qui concerne sa robustesse vis-à-vis. du bruit ou d'une 
perturbation des échantillons discrets donnés en entrée. 

Une étude est menée en ce moment sur l'écriture dans un 
premier temps d'un filtre générant des chaînes cohérentes à 
partir de l'échantillon de départ, et sur l'écriture d'un autre 
algorithme d'inférence dans un second temps basé sur la 
reconnaissance tolérante, i.e. on prend en compte le fait que 
les données de départ peuvent être bruitées et on essaie de 
corriger ce bruit, du moins d'inclure dans l'information la 
donnée non bruitée. Evidemment cette démarche doit être 
faite automatiquement et non par l'intermédiaire d'un expert 
étranger au programme qui jugerait de la validité de telle 
information ou de telle autre. : 
Toutes ces méthodes ont de plus été démontrées 
mathématiquement en introduisant une topologie sur l'espace 
des chaînes, ce qui permet de faire le lien entre les 
mathématiques classiques et un domaine qui avait a priori peu 
de rapport avec elles. 

Les programmes sont insérés tels quels au sein de l'algorithme 
d'apprentissage et donnent de premiers résultats excellents. 


C1.10 Apprentissage chez les oviels 


V.ELZIERE (B Burg) 

Pour les besoins de CANDIDE, un algorithme de 
regroupement (clustering) a été implanté à partir de celui 
décrit par Michalski (Machine Learning I, chap. 4), 
conduisant à un programme, Cluster-PAF, opérationnel sur 
Sun et Symbolics. L'inconvénient majeur de cet algorithme 
réside dans sa rapide explosion combinatoire : il ne peut 
raisonnablement s'appliquer qu'à des objets de petite taille, 
contenant peu de variables ayant elles même un ensemble de 
valeurs possibles très réduit [typiquement le produit du 
nombre de variables par le nombre de valeurs est limité à 14]. 
Il était donc souhaitable d'obtenir une méthode moins brutale 
de regroupement qui puisse s'appliquer à des problèmes 
nettement plus complexes. Le même Michalski décrivant le 
principe d'un algorithme plus puissant dans Machine 
Learning, chap. 11, l'objet de ce travail est d'en bâtir une 
variante et de l'implanter. Les essais visant à évaluer 
l'efficacité du programme sont alors effectués sur un 
problème de classification d'automates finis inspiré de AK. 
Dewdney. 

C1.10a Vie et mort des oviels | 

Les oviels (Objets VIvants ELémentaires) sont des automates 


finis à 6 états codés sur 49 variables. Chaque oviel évolue en 
fonction d'un unique signal extérieur, composé d'un motif 
binaire e1e2...en. A la réception du bit ex, l'oviel change 
d'état et émet un bit sx. Nous ajoutons à cette évolution un 


critère d'apprentissage s'appuyant sur la santé w de l'oviel : 
lorsque sk=ex+1, autrement dit lorsque l'oviel “prévoit” le 


signal qu'il va recevoir, il a une récompense en santé W <— w 
+ p*T. Dans le cas contraire, il est pénalisé et y < w + p-. 


Lorsque w = 0, l'oviel meurt, ce qui constitue un échec 
définitif. 

La population initiale, tirée aléatoirement, évolue donc sur la 
base de cette règle. Elle est aussi modifiée par la copulation 
de deux oviels entre eux, conduisant à un nouvel automate 
généré à partir de ses deux parents par une fonction de 
copulation Z ; et par le cancer qui modifie aléatoirement l'un 
des éléments du code d'un oviel. 

L'objectif est de classifier les codes des automates -ou 
chromosomes- pour déterminer d'éventuels types de 
chromosomes conduisant à la mort et éviter la transmission de 
ces gènes par la fonction }.. 

C1.10b L'algorithme de regroupement CLU-11 


Dans l'exemple que nous étudions effectivement, on a 6 = 3. 
Les trois états À, B ou C d'un oviel permettent donc de 
construire des chromosomes comme : 
(A1BOAOC1AO0CO) 


Nous cherchons alors à regrouper N oviels de ce genre en k 
classes disjointes. Par exemple les oviels ©] = (A 1 B 0 A 0 


C1AO0C0)etw =(B1B0OAOC 1 A0 C 0) peuvent 
être regroupés en 2 classes : la première est celle des oviels 
dont la première variable, vo, est A ; la deuxième, celle dans 
laquelle vo = B. 

Les difficultés surgissent dès qu'il s'agit de classer une 
centaine des 6% = 46 656 oviels possibles. Nous allons donc 
décrire succinctement l'algorithme utilisé en nous arrêtant sur 
les problèmes d'espace mémoire ou de temps. 

Le principe de l'algorithme est le suivant : pour regrouper les 
N oviels en k classes, on commence à choisir, par exemple au 
hasard, k oviels parmi les N. On essaie alors de ranger les N- 
k oviels restants dans les k amas formés autour de ces oviels 
initiaux. | 
Un:amas N(@lQ) est une fonction permettant de différencier 
l'oviel @ des oviels de {2 en autorisant uniquement certaines 
valeurs des variables. La construction des amas représente la 
principale difficulté pratique : on doit en effet les fabriquer à 
partir des amas élémentaires N(@lo'), ©’ e Q en en formant 
la conjonction. Un simple coup d'œil suffit pour voir que ce 
calcul conduit à une explosion combinatoire donnant de 
l'ordre de 6100 éléments en résultat. En fait, le résultat étant 
borné par le nombre maximal d'oviels, des simplifications le 


réduisent à la limite des 2029 possibles, ce qui n'est pas 
raisonnable pour peu que 8 soit assez grand. On doit donc 
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élaguer au fur et à mesure de la construction de la 
disjonction, ce qui nécessite l'emploi de critères de choix. 

A l'heure actuelle, ces critères jouent essentiellement sur la 
simplicité de l'écriture de l'amas et sur sa sélectivité, 
autrement dit sur le nombre d'oviels qu'il décrit. Ce nombre, 
théoriquement égal à 1, est en effet non directement 
prédictible après élagage. 

L'algorithme est complété à partir des amas par des fonctions 
de disjonction et de simplification plus ou moins heuristiques. 
Les résultats partiels obtenus pour l'instant laissent penser que 
l'ensemble donnera des solutions satisfaisantes. La sélectivité, 
notamment, semble bien maîtrisée et l'élagage n'aboutit pas à 
des résultats aberrants. Les diverses procédures, encore au 
stade du développement, ont été portées en Common-Lisp sur 
une Symbolics 3600 et tournent en un temps acceptable. 

Si les résultats sont insuffisamment précis, l'algorithme 
pourra être affiné par l'adjonction de critères élagage plus 
fins, très —trop ?— vaguement décrits dans l'article de 
Michalski. Reste enfin à prouver la correction de 
l'algorithme, qui a l'heure actuelle n'est qu'intuitive. 

La qualité du programme sera très prochainement testée sur 
les oviels dans une fonction de copulation. 


C1.11 Aide à la configuration radar et capteurs du 
dispositif de mesures du futur BEM. 

X.MERLO, J.M.FRECAUT 

C1.11a L'étude 

La DEN a confié au CTME la supervision du programme du 
dispositif de mesures du nouveau bâtiment d'essais du Groupe 
Naval d'Essais et Mesures de la marine (GNEM), qui incluera 
plusieurs radars, des antennes de télémesures et d'autres 
moyens annexes. Cette étude vise à préciser quelles 
pourraient être les applications des techniques de 
programmation évoluées de l'intelligence artificielle et de la 
robotique à ce dispositif. L'ensemble de ces moyens est 
destiné à la trajectographie et à l'analyse de la phase finale 
des essais de missiles. Dans le cas des essais stratégiques 
balistiques, mission prioritaire et dimensionnante du 
dispositif, il s'agit de suivre les différents objets, éjectés du 
porteur, pendant la fin de la phase balistique et pendant la 
phase de rentrée dans l'atmosphère. Ce projet présente trois 
caractéristiques: complexité, nécessaire rapidité de réaction 
des opérateurs, souplesse de reconfiguration, qui conduisent à 
étudier les applications de techniques modernes de la 
robotique et de l'informatique, appelées à un important 
développement dans les dix années à venir et au-delà, 
pendant la durée de vie du futur bâtiment d'essais et de 
mesure. Îl est également nécessaire d'en prévoir l'utilisation 
éventuelle tôt dans la définition du projet, de manière à en 
faciliter les applications, immédiates et futures. Ont été en 
particulier analysées dans ce rapport les décisions impliquées 
par un essai, tant dans la phase de préparation de mission que 
dans celle de conduite du tir réel. 


La complexité résultant pour le dispositif dans son ensemble 
du nombre d'objets à suivre (jusqu'à une vingtaine), du 
nombre de moyens de mesures, et du nombre de missions à 
accomplir, a conduit à s'interroger sur les moyens d'aider les 
opérateurs à gérer et à reconfigurer le système, ou même à le 
commander automatiquement pour certaines phases. de la 
mission, avec validation humaine. On se trouve ici tout à fait 
dans le cas d'un système robotique, où des capteurs doivent 
suivre un certain nombre d'objets. Le contrôle de tels 
systèmes complexes, avec les contraintes d'emploi des 
moyens de mesures (problèmes d'affectation des moyens aux 
objets, problèmes d'incompatibilité, limitation du champ de 
battage..), incluant tant de variables, ainsi que les systèmes 
d'aide à la décision et d'aide aux utilisateurs relèverait a priori 
de l'intelligence artificielle, d'où cette étude. 


D'autres facteurs sont également en faveur de l'utilisation de 
telles techniques. En premier lieu, le temps très court de 
durée utile de la mission réelle (environ 40s), qui nécessite 
une grande rapidité de réaction des opérateurs dans le cas d'un 
écart par rapport au scénario prévu, et qui favorise donc un 
maximum d'aide à l'utilisateur, tant du point de vue des 
interfaces (présentation des données et de la situation), que 
du point de vue de l'aide à la décision. D'autre part, le fait 
que le navire plate-forme doive être capable de s'adapter 
rapidement à toute nouvelle configuration du tir sans aide 
extérieure, avec un petit nombre de personnes capables de 
reconfigurer le système en pleine mer rend nécessaire une 


92 


certaine rapidité dans le développement de nouveaux 
scénarios. La souplesse d'adaptation et de développement 
d'applications est également une des caractéristiques de 
l'intelligence artificielle. 


Le laboratoire "Système de Perception" du CREA, spécialisé 
dans la perception robotique, et en particulier dans les 
systèmes multicapteurs, pouvait donc fournir les compétences 
qui ont permis cette étude, afin d'apporter à l'équipe 
responsable des spécifications du futur dispositif de mesures 
un premier éclairage du problème sous l'angle intelligence 
artificielle et robotique, et d'en tirer les conséquences. Sans 
essayer de donner une définition de l'intelligence artificielle, 
on peut la délimiter au moins dans ce cas particulier comme 
tout ce qui touche aux processus de décision, qu'ils aient lieu 
avant, pendant ou après le tir, ainsi que le support de ces 
processus automatiques de décision et le support des prises de 
décisions humaines. 

C1.11b Présentation du travail 


Dans un premier temps nous nous sommes consacrés à la 
familiarisation avec le problème grâce à des entretiens avec 
les personnes concernées, et à la participation aux réunions 
de définition du dispositif en tant qu'observateur (nos 
questions ont vraisemblablement aidé à stimuler la réflexion 
sur les problèmes de spécification). Nous avons en particulier 
été amenés à rencontrer les responsables des mesures sur le 
bâtiment d'essais actuel, le "Henri Poincaré" basé à Brest, au 
cours de visites et de réunions, ainsi qu'au cours d'un séjour 
en mer pendant lequel était prévu un tir de missile. L'essai n'a 
malheureusement pas pu avoir lieu, mais nous avons 
néammoins pu observer en situation le déroulement des 
différentes tâches lors des entraînements et lors des missions 
courantes. 





Dans un deuxième temps, nous avons participé activement 
aux réunions du groupe "système" destinées à préciser les 
rôles des différentes parties du dispositif au sein de l'équipe 
de définition. A cette occasion, les sujets les plus proches des 
aspects intelligence artificielle et robotique ont été pris en 
charge, avec notamment le problème des contrôles 
nécessaires à la réalisation des missions de mesures. Des 
compétences nouvelles ont donc été apportées dans les 
réunions de définition des différentes fonctions du dispositif. 
Ainsi ce travail est le résultat d'une interaction avec l'équipe 
de définition du dispositif de mesures futur. 


On a finalement abouti à une description dépouillée du 
dispositif et de la principale mission de mesures des essais 
balistiques, avec une présentation synthétique de la 
décomposition temporelle de la mission à une représentation 
des processus de décision dans les différentes fonctions du 
dispositif analysées en intégration avec l'équipe de 
spécification et des problèmes. Nous y avons intégré les 
informations issues du séjour en mer, des réunions systèmes, 
et du premier document de spécification PC radar, filtrées par 
l'aspect intelligence artificielle et robotique, en mettant 
notamment l'accent sur les points suivants: préparation de 
mission, stratégies de contrôle des capteurs, aspects humains 
du dispositif, et évolution du système. Ceci débouche sur la 
réalisation d'une maquette à l'échéance d'un an, incluant une 
aide à la préparation de mission et un programme de 
simulation des séquentiels de mission générés par la 
préparation de mission. 





C2 Architectures matérielles 


C2.1 Evolution de HECATE VO 

S. DACIC ((Thèse (PARIS XT) C. FLUHR)B.Zavidovique) 
La "manip" probatoire HECATE VO est maintenant arrivée à 
un niveau de maturité suffisant pour permettre à des 
nouveaux arrivants de l'exploiter. Rappelons brièvement 
l'environnement électronique et informatique. 

Le système exécutif : 

La machine de commande et de contrôle est construite autour 
d'une architecture quadri-processeurs 68000 et permet le 
raccordement des modules de traitement d'images grâce à son 
bus local standard de type VME. Un des processeurs est 
dédié au système d'exploitation UNIX, ceci pour le 
développement et l'exécution des programmes de haut niveau 
consommateurs d'un grand nombre d'utilitaires. Les trois 
autres processeurs sont sous le contrôle du système distribué 
CHORUS (développé par l'INRIA). Ce système permet de 
répondre aux exigences temps réel grâce à la récupération 
aisée des interruptions. Les programmeurs disposent d'un 
langage d'acteurs qui communiquent entre eux par échange de 
messages à travers des portes de communication: l'arrivée 
d'un message sur une porte déclenche une étape de 
traitements. 

C2.1.a Matériel 


Quatre modules spécialisés constituent HECATE VO: 
CAPTIO 


qui se charge de l'acquisition des images et des pré- 
traitements. L'acquisition d'images peut se faire à des formats 
et à des cadences programmables, sous forme vidéo 
analogique où numérique indifféremment. Le module permet 
aussi d'effectuer quelques pré-traitements d'images. Ceci, 
dans le but, d'une part de pallier à certains défauts de l'image 
(images bruitées, peu contrastées …) et d'autre part, 
d'appliquer des traitements élémentaires à l'aide d'opérateurs 
spécialisés afin d'adapter le flot de données aux manipulations 
ultérieures. 

Le module de codage 

a pour fonction de fournir au module DICREM des 
“graphèmes". La séquence de programmes qui se déroule 
pour ceci est la suivante : 

- acquisition d'une image binaire venant de CAPTIO 

- extraction du contour d'un objet de l'image 

- remplissage de cette forme 

- approximation polygonale 

- codage de Freemann sur les segments et envoi à DICREM. 
DICREM 

permet de réaliser un processus d'elastic matching. C'est un 
algorithme câblé de reconnaissance de la parole adapté à 
l'image. Il compare les équivalents phonèmes (les graphèmes) 
de la forme, appliqués à son entrée, avec un dictionnaire 
disponible dans sa mémoire, à la vitesse d'environ mille 
formes par seconde. 

Le module Convolueur Généralisé 

permet d'effectuer des opérations simples (addition, 
multiplication, sup, inf …) entre pixels d'un voisinage 3x3. 
Les traitements sont appliqués sur l'ensemble de l'image en 
temps réel. Il est composé de deux parties identiques, qui 
peuvent être associées en série ou en parallèle, avec ou sans 
mémoire de look-up. Dans HEÉCATE VO, il est 
principalement utilisé pour extraire les contours d'un objet de 
façon plus robuste, à l'aide d'un masque de convolution. 
C2.1b Logiciel (cf.$C3) 

Chaque module possède son propre langage de commande 
exotique. Il existe donc un environnement de programmation 
convivial donnant une vue homogène de tous les modules à 
un utilisateur non spécialiste, et conçu de façon à pouvoir 
inclure aisément de nouveaux modules. Cet environnement 
qui va de l'utilisateur jusqu'aux différents assembleurs des 
modules est décrit par le synoptique. 

C2.1c Evolutions 

L'évolution logique d'HECATE VO est l'introduction de 
nouveaux modules. Ceci implique une reconfiguration 
informatique. En effet, d'une configuration mono machine 
(SIM90 quadri-processeurs contrôlée par une console 
graphique) nous sommes passés à une configuration multi 
machines sur un réseau local (deux SIM90 quadri-processeurs 
coopérant avec une station de travail couleur de type SUN 
3/60 reliées par un réseau Ethernet). 


93 


1) L'aspect système 

reste identique dans sa philosophie, à savoir, coexistence des 
deux systèmes UNIX et CHORUS. La différence se situe 
dans le processeur dédié aux logiciels de haut niveau, qui est 
maintenant le 68020 de la station de travail, ainsi que dans la 
présence de deux machines chorix (CHORus/unIX). La 
communication entre UNIX et CHORUS ainsi que la 
communication CHORUS CHORUS entre chorix1 et chorix2 
se voit dotée ainsi d'une couche supplémentaire gérant le 
protocole de communication Ethernet. 

2) Le matériel 

s'enrichit de trois modules supplémentaires : 

* Le module courbe 

Les courbes sont d'exploitation fréquente en traitements 
d'images. Par exemple, dans un processus d'extraction de 
contour par seuillage, un histogramme de l'image permet 
d'obtenir un seuil optimal assurant la séparation entre le fond 
et la forme. Le circuit courbe est actuellement câblé de façon 
à pouvoir élaborer les courbes résultant des projections 
horizontales et verticales de l'image à la volée. Le max de 
chacune de ces courbes passé à CAPTIO permettra, par 
exemple, de caler des fenêtres sur un objet et ainsi de faire de 
la poursuite de cible. 

* Le module NYX 


est développé pour répondre aux besoins de reséquencement 
d'informations image par transformations géométriques à la 
volée des capteurs. Ce module peut être vu comme une 
réponse au problème de traitement d'adresses à la volée du 
module MORPHEE. 

* Le module COLISE 

découle d'une structuration d'algorithmes de segmentation en 
régions dans le but d'orienter la spécification d'une 
architecture temps réel. Cette architecture se présente comme 
un assembleur câblé adapté à la segmentation en régions, et 
dont les instructions sont les éléments d'une bibliothèque 
câblée d'opérateurs. 

3) Le logiciel 

se voit par contre profondément modifié. Outre les acteurs 
des nouveaux modules à décrire, un travail important consiste 
à transférer les logiciels de haut niveau sur la station de 
travail SUN. En ce qui concerne l'interface utilisateur, nous 
avons décidé d'utiliser l'environnement de programmation 
graphique Aïda de la société ILOG. Aïda est un système de 
construction d'interfaces général, écrit en Le-Lisp. Un 
langage d'image permet de construire une représentation 
structurée de l'écran, une boucle d'interaction s'occupe de 
suivre les mouvements de la souris, des mécanismes objets 
permettent de construire un modèle propre des objets 
visualisés à l'écran. GENIUS (GENérateur d'Interfaces 
Utilisateur Spécialisées) a donc été complètement repensé en 
Le-Lisp et en langage orienté objets. La couche de 
communication entre le monde UNIX et le monde CHORUS 
n'est plus, du fait de sa complexité croissante, gérée par 
l'interface (comme c'était le cas dans la version VO). Cette 
gestion est donc assurée par un programme indépendant 
s'appuyant sur une bibliothèque de "fonctions traitements 
d'images". Ce programme constitue en quelque sorte une 
interface procédurale aux architectures. Ce système permet 
donc d'écrire des applications, des algorithmes tournant sur 
HECATE dans des langages classiques (C, Lisp .) 


Friendly interface for complex machine programming 
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C2.2 COLISE 
MLECCHER (thäseBesapcon) G.STAMON) B.Zavidovique) 


PP e 


1) Analyse de scène en temps réel 

Ceci en vue d'une prise de décision suivie d'une action. 
Formulation algorithmique du problème 

Les problèmes généralement posés en analyse de scène, 
s'énoncent simplement à partir de concepts de haut niveau. 
Ceux-ci ne s'expriment simplement qu'en langage naturel. Ils 
subissent alors l'effet d'hypothèses simplificatrices pour être 
traduits en un code exécutable. : 

Il reste qu'aucun formalisme suffisamment général ne 


supporte les associations des différents opérateurs. Celui-ci 
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dépend certainement tout à la fois de la manière d'exprimer le 
problème et de concepts liés à l'efficacité d'une implantation 
matérielle.(cf. $ C4.2) 

L'exemple d'un système de défense à l'affût de la proximité 
d'un projectile analyserait l'espace comme: 

Décomposer l'image en N régions, conserver celles dont la 
forme pourrait être retenue comme projectile, les analyser 
selon l'axe des distances, puis stocker celles dont la vitesse 
est très grande. 

Mais une autre approche du problème tout aussi plausible est 
d'analyser la scène par le mouvement des régions selon l'axe 
des distances. La fomulation parallèle du problème à bas 
niveau conduit à utiliser des chemins de communication 
verticaux. entre les modules d'extraction de primitives. 

2) Emulateur VS automate | 

On désire analyser le fonctionnement de notre émulateur pour 
en déduire l'automate optimal juste adapté au scénario donné. 
Il est certainement intéressant de pouvoir analyser séparément 
les parties opératives des parties contrôle. Certains 
compilateurs de silicium peuvent d'ores et déjà exploiter les 
chemins de donnée (compilateur datapath VTI). 

C2.2b Algorithmie région 

L'esprit de notre démarche est similaire à celle de R.LS.C. 
qui est de rechercher le jeu minimal d'instructions 
nécessaires à une implantation efficace (instrutions à forte 
occurence , ou coûteuses en temps de calcul). 

Pour le cas qui nous concerne, appliqué à une machine 
parallèle le problème devient: 

chercher le meilleur compromis, 

- jeu d'instruction 
- communication. 

1) Contraintes liées à l'application. 

-Offrir tout à la fois une communication de haut niveau et de 
bas niveau pour traiter la plus grande classe d'association. 
-Définir une architecture suffisamment souple pour que la 
plus grande classe d'algorithmes de segmentation puisse y être 
implantée efficacement. 

-Conduire à des implantations qui facilitent le diagnostic. 
-Conserver le souci du temps réel à la fois pour l'émulation et 
pour l'automate diagnostiqué. 

2) Contraintes liées au matériel 

-Nécessité d'avoir des contrôles élémentaires simples pour 
que l'ensemble de la machine reste pilotable. 

-Segmenter les opérateurs et les moyens de communication en 
sous-ensembles "technologiquement réalistes". 

-Autoriser des associations structurelles qui exploitent au 
mieux le matériel disponible. 

C2.2c Réalisation de COLISE 

1) Architecture (Rappel) 

COLISE regroupe un ensemble de bibliothèques d'opérateurs 
câblés que l'on associe à la demande pour construire les 
algorithmes. 

Le language comporte des primitives d'exécution (opérations) 
et d'association (chemins de communications) qui sont 
physiquement présentes dans la machine. Les ressources 
possèdent un certain nombre de propriétés communes qui 
facilitent les associations. 

Elles sont câblées, synchrones, de débit identique. 

Elles peuvent s'exécuter simultanément (parallélisme de haut 
niveau) et s'associent à bas niveau en parallèle, cascade ou 
tranche pour s'adapter finement aux contraintes de 
l'application. (temps, dynamique de calcul, complexité) 

2) Implantation 

Trois bibliothèques d'opérateurs 

- Opérations simples (elles vectorisent l'image): 

. monadiques: seuillages, Log(x), anamorphoses… 

. dyadiques: arithmétiques , logiques et associatives 

Tri, produit, quotient, seuil dynamique,.…d'une manière plus 
générale elles assument les traitements sur les modèles 
d'image locaux. 

-Opérations parallèles: Elles recouvrent les mêmes familles 
d'opérations que la classe précédente elles possèdent une 
communication optimisée pour le traitement des voisinages et 
des multi-images. Ils sont adaptés au traitement des modèles 
semi-locaux. Les opérateurs sont implanté sur une srtucture 
pipe-line SIMD 1D et pipe-line 2D 

-Opérations globales: Le contrôle et le séquencement des 
opérations de traitement d'image requièrent une analyse des 
données traitées par les deux classes d'opérateurs précédents. 
* Le rôle des opérations globales est donc de condenser 





l'information afin qu'elle puisse être mise en relation avec un 
modèle d'analyse global. 

C2.2d Programmation 

Les traitements sont représentés par des graphes d'opérateurs 
où les nœuds représentent les fonctions de traitement, et les 
liaisons les chemins de communication. Le langage décrit les 
applications de manière fonctionnelle par une représentation 
qui peut être à la fois graphique et "verbeuse". (Cf. $ C2.1, 
C4.1 et 2) 

Hormis la réalisation effective nous avons essentiellement mis 
l'accent ces derniers mois sur la constitution d'exemples 
significatifs, dont deux sont évoqués ci-après. | 

1) Méthode de OLLANDER 

1° Choisir une région dans l'image 

2° Calculer les différents histogrammes des caractéristiques 
de la région R,V,B,Y,Yb, Yr,LS,T... 
3° Lisser les histogrammes 

4° Choisir le meilleur pic parmi les différents histogrammes 
5° Seuiller la région aux deux minima 


, 


O Amplitude signal 255 


+ 


Population 


6° Générer le masque correspondant aux nouvelles régions 

7° Lisser le masque, extraire les régions. 

8° Retirer la surface de ces régions de celle initialement 
considérée:critère de taille minimale. 

9° Sauvegarder ces régions et réappliquer la méthode sur 
chacune d'elle jusqu'a segmentation complète. 

10° Appliquer la segmentation sur le reste de la région. 
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Représentation graphique de l'algorithme 


5. 


La transformation T1 calcule Y,Yr,Yb à partir des 
combinaisons linéaires du système matriciel télévision 


Ÿ =0,30R + 0,59 V +0,11B 
Yr =0,50R + 0,00 V - 0,50B 
Yb =-0,25 R + 0,50 V - 0,25B 


La transformation T2 calcule les composantes intensité, 
saturation, teinte 


I =0,33R +0,33 V +0,33 B 
S = 1- \(3min(R,G,B),R +G + B) 


V-B/3(R+V+2B) 
T= B-R/3(V+B-2R) +1/3 
R-V/3(R+B-2V) + 1/3 


2) Algorithme de BURT 
1° Initialisation ascendante 

Calculer la valeur de chaque père comme étant la 
moyenne des 16fils. 
2° Etablissement des liens 

Rechercher pour chaque noeud quel est le père 
(parmi 4) dont la moyenne est la plus proche sachant qu'un 
père possède entre 0 et 16 fils. 
3° Phase ascendante 

En utilisant les liens calculés précédemment, 
recalculer la moyenne de chaque père. 
4° Itérations 

Itérer les phases 2° et 3° jusqu'à stabilisation des 
relations père <->fils. Puis projeter les liens d'un niveau 
donné sur la base de la pyramide. 


Le résultat est N régions, N de la forme 2" 


Si min (R,V,B) =B 
Si min (R,V,B)=R 
Si min (R,V,B) = V 


3) Implantation de BURT sur COLISE 
1° Phase ascendante initiale 

-élaboration d'un voisinage 4x4 

-Calcul de la moyenne attribuée au père 

- idem pour les niveaux suivants 
2° Etablir les liens père <->fils 

- rechercher pour chaque noeud parmi 4 pères celui 
dont la moyenne est la plus proche. 

effectuer par tri associatif des pères avec comme clé 
la différence de moyenne -> image des liens. 
3° Calcul du niveau des pères 

-Un voisinage de 4x4 élabore pour chaque père 
(niv1) les 16 candidats fils (niv I-1) une moyennne des 
niveaux sous contrainte de l'image des liens et donne la 
nouvelle valeur au père . 

-faire jusqu'au sommet. 
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C2.3 MORPHEE 

P.KAJFASZ 

La machine HECATE repose sur la notion de Décomposition 
Naturelle Généralisée. Elle est composée de différents 
modules de traitement de l'information-image (numérisation, 
prétraitements, extraction de contours, extraction de région, 
reconnaissance de forme par correspondances élastiques, ….). 
Ces modules ne traitent que de l'information-image, les 
entrées et les sorties se faisant au format le mieux adapté aux 
fonctions câblées de traitement d'image qu'ils renferment. Ce 
fait rend la connexion entre les modules difficile et oblige à 
l'emploi d'un système de changement de format des données 
sur chaque liaison inter-module ( ceci correspond 
généralement à une mémoire associée à un système de 
génération d'adresses de reséquencement en temps réel ). 
Cette méthode présente de nombreux inconvénients (volume 
électronique, complexité de mise en œuvre générale, .….), 
_ aussi le choix de la réalisation d'un module spécialisé dans la 
remise en forme des données-images a-t-elle été décidée. Ce 
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module se présente donc sous la forme d'une "ressource" 
commune aux modules constitutifs de la machine HECATE. 





Acquisition + nu —LSnucs) DéCisien / Action 
Primitives Formes 
Décomposition Neturelle Généralisée 


Les principales contraintes auxquelles se trouve confronté ce 
module, nommé MORPHÉE ( pour MOdule de 
Reséquencement Pour HEcatE ), peuvent être listées comme 
suit : 

- reséquencement des informations-images entre un nombre 
important d'opérateurs de traitement. 

- chaque opérateur de traitement est considéré comme 
fonctionnant de façon asynchrone vis-à-vis des autres 
opérateurs de HECATE. | 

- les accès à la mémoire peuvent être simultanés. 

- l'accès aux données doit être sans conflit au cours de toute 
transaction. 

-la conception de MORPHEE, doit autoriser la 
reconfiguration dynamique des accès et la reconfiguration 
dynamique des allocations mémoire 

- les générateurs d'adresses de reséquencement doivent être 
complètement et indépendamment programmables. 

C2.3a Description du module 

MORPHEE comporte quatre parties principales: 

- la mémoire , qui permet le stockage en temps réel des 
données avant leur réacheminement vers d'autres opérateurs. 

- le réseau d'interconnexion, qui aiguille les données entre 
MORPHEE et les opérateurs de traitement d'image. 

- le générateur d'adresses de reséquencement, qui fournit les 
séquenceurs nécessaires à la prise des informations en 
provenance des opérateurs et à la fourniture des informations 
à l'opérateur demandeur dans son format spécifique. 

- le L-Contrôleur, qui gère l'ensemble de la commande bas- 
niveau de MORPHEE, reconfigure le module en temps réel, 
et réalise l'interface avec le superviseur 68000. 
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La mémoire, quant à elle, se présente sous la forme : 
- de bancs mémoire physique ( B.M.P. ) qui regroupent la 
mémoire de base du module. 


- de bancs mémoire logique ( B.M.L. ) qui transforment les 
adresses logiques fournies par les générateurs d'adresses en 
des adresses physiques correspondant à la position réelle des 
données en mémoire 

L'implantation matérielle tient compte de cette décomposition 
architecturale ne se transcrit cependant pas directement sous 
forme d' “entités cartes électroniques", une nouvelle 
décomposition tenant compte des diverses contraintes liées à 
la réalisation-même de ce module : | 

- taille des cartes-mère ( 500mm x 500mm ) 

- taille du rack ( 12 positions ) 

- nombre de signaux disponibles sur le fond de panier ( 624 
Signaux ) 

-la technologie employée ( TTL/CMOS, ECL, AsGa) 
-alimentations 






Regroupement en 
Bancs 
Mémoire 


Logiques 


Mémoire 


Physiques 


Elle fait apparaître 5 "entités cartes" qui seront: 


Les cartes Bancs Mémoire Physique reçoivent et/ou émettent 
des mots sur une largeur de 32 bits. Lors d'une phase 
d'écriture, ces mots sont obtenus par concaténation des 
données en provenance des opérateurs les fournissant dans le 
BML_IN. Lors d'une phase de lecture, ces mots sont scindés 
dans le BML_OUT pour être envoyés vers les opérateurs 
receveurs. 

Tous les transferts se font sur la base du 1/8 de l'horloge mère 
de 160 MHz soit 20 MHz. 

Elles comportent : 

- deux Bancs Mémoire Physique 

- le démultiplexage et le décodage des adresses en ECL 
(AMPLI _BMP_X &AMPLI_ADR_X) 

- le démultiplexage en ECL des données en écriture dans les 
BMP en provenance de la carte BML_ IN (AMPLI DIN x ) 

- années lues et dirigées vers la carte BML OUT 

- la réception des horloges de séquencement 

- carte BML IN 

Elle comporte l'ensemble des Bancs Mémoire Logique en 
entrée dans le module. De plus, lui sont adjoints le 
générateurs d'horloges en AsGa, le u-Contrôleur, ainsi que 
l'interface entre le 1-Contrôleur et l'environnement multi- 
68000 SIM90 sous CHORUS. 

La mémoire présente sur la carte BMP autorise des accès sur 
32 bits à une fréquence typique de 20 MHz, aussi pour 
optimiser les transferts ainsi que l'occupation de la mémoire 
au sein du module est-il nécessaire de regrouper les données 
en provenance des opérateurs émetteurs. Cela est réalisé par 
l'intermédiaire d'une ALU 32 bits qui "incruste" dans le mot 
devant être enregistré la donnée en entrée, en fonction de son 
apparition temporelle et de sa taille. 

Cette méthode permet d'obtenir une occupation maximale de 
la mémoire lorsque les données en entrée présentent une taille 
puissance de 2, qui est le cas “classique”, et optimale dans 


bien des cas. 


Pour utiliser malgré tout l'espace mémoire non affecté, il est 
possible de rajouter un séquenceur interne à la carte BMP 
pour créé un mode d'accès de style FIFO. 

La génération des horloges est réalisée par un module 
spécialisé utilisant des composants en technologie AsGa. A 
partir d'une horloge mère dont la fréquence est continuement 
ajustable entre 80 MHz et 220MH/Zz (fournie par une PLL), 
huit horloges déphasées sont crées fornissant les horloges de 
base nécessaires au séquencement des informations dans tout 
le module ( leur fréquence typique étant de 20 MHz ). 

Ces horloges sont directement transmisent sur le fond de 
panier du module avec des niveau compatibles E.C.L., 
correspondants aux niveaux de transmission sur le FdP, ainsi 
qu'aux niveaux de réception des horloges sur les diverses 
cartes constitutives de MORPHEE. 

Lors du maquettage de NYX, sont apparues des difficultés de 
réalisation liées à la transmission des sigraux 
"informatiques". Afin de nous affranchir des problèmes que 
pose le déport d'un bus informatique du superviseur muilti- 
68000 au module MORPHEE l'utilsation d'une transmission 
sur paires différentielles a été choisie. Néanmoins, 
l'utilisation d'une transmission sur fibres optiques est à 
envisager, pour répondre au schéma général des 
communications dans la machine HECATE. 

De façon parallèle à la mise au format des mots en entrée 
dans le module, la transformation des adresses logiques de 
séquencement fournies par la carte GENE ADR en adresses 
physique est réalisée. 

À partir de l'adresse logique sont générés : 

- le numéro de BMP ( 6 bits ) 

- l'adresse physique ( 31 bits ) 

L'adresse physique est obtenu après passage de l'adresse 
logique au travers d'une M.M.U. contenant un additionneur 
ainsi que des registres de redirection. 


La carte BML_OUT à l'opposé de la carte BML IN réalise 
le décompactage des données lues. Ceci est obtenu, comme 
dans BML_IN par l'utilsation d'une ALU 32 bits qui, à partir 
de la taille du mot en sortie et des bits de poids faible de 
l'adresse logique, extrait la donnée à émettre. 

- Cart 

Elle regroupe l'ensemble des générateurs d'adresses associés 
aux séquencements de données. 

Cette carte fournit les adresses logiques de séquencement des 
données dans le module MORPHEE. Ün générateur 
d'adresses spécifique est attaché à chacun des douze bus 
d'adressage. Le multiplexage est ensuite effectué pour 
permettre la transmission sur le fond de panier et l'envoie vers 
la carte BML IN. | 

Diverses stratégies peuvent être employées pour la génération 
de ces adresses. 

La méthode la plus simple, intellectuellement parlant, 
consiste à développer une fonction câblée permettant de 
répondre à tous les cas de reséquencements demandés, en 
utilisant les briques de base disponibles chez les fabicants de 
composants. Ainsi, l'on peut espérer, en utilisant des 
compteurs, des additionneurs, des ALUS, des multiplieurs, et 
des tables de transcodage, interconnectés entre-eux et/ou 
multiplexés, obtenir la fonction souhaitée, générant les 
adresses de séquencement en temps réel. La carte 
électronique résultante, supportant ce temps réel, serait : 

1 -d'une taille importante 

2 -d'une exploitation fortement sous-optimale ( i.e. : lors d'un 
séquencement de style compteur, seul les compteurs seraient 
utilisés ) 

3 - spécifique aux séquencements envisagés en tout premier 
lieu, et ne répondant pas forcément aux demandes de 
séquencement que pourrait demander HECATE dans sa phase 
d'exploitation. 

Une seconde méthode, cette fois-ci générale, consiste à créer 
la fonction demandée à partir d'un ensemble de processeurs 
élémentaires (sur 1 bit, par exemple) qui seront programmées 
et interconnectées par le Ji-contôleur sur la requête du 
superviseur multi-68000. On réalise ainsi un Générateur de 
Séquenceurs Généralisé. Connaissant le nombre de 
processeurs élémentaires ainsi que les possibilités 
d'interconnexion entre entre ces processeurs, il est 
relativement aisé de construire la fonction demandée par 
l'utilisateur, même si elles fonctions de base prédéfinies, 
d'étendre sa structure pour permettre la réalisation de 
fonctions plus complexes. 
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Néanmoins, le fait que ce générateur soit “Généralisé" 
apporte des problèmes non négligeables, en effet il est 
relativement difficile de construire sur ce type d'architecture 
des opérations telles que la multiplication, ou la division à 20 
MHZ sans consommer une quantité gigantesque de 
processeurs élémentaires et d'interconnexions entre 
processeurs. 
Aussi, pour répondre au mieux aux soucis de : 
- "programmabilité” des séquenceurs d'adresses 
- reprogrammation dynamique 
- temps réel 
- adéquation entre les développements électroniques et les 
fonctions résultantes de séquencement obtenues. 
Une solution mixte sera envisagée, employant : 
- des opérateurs élémentaires 
- des systèmes d'interconnexions entre opérateurs 
- des opérateurs spécialisés 

- multiplication 

- division 

- calcul flottant 

- Sin/cos 

- tables de transcodage 
- carte À BAR 
Elle supporte l'ensemble de l'interfaçage entre les opérateurs 
de traitement d'image de HECATE et MORPHEE, le réseau 
d'interconnexion, ainsi que le système de FIFO permettant de 
rendre le module asynchrone vis-à-vis de ses utilisateurs. 
En raison du découpage obligatoire de l'ensemble des Bancs 
Mémoire Logique en deux entités distinctes BML_IN et 
BML_OUT, cette carte X_BAR se verra également scindée 
en deux pour pouvoir être associée respectivement aux 
données en entrée dans MORPHEE et aux données en sortie. 
Le support physique pour le transport des informations-image 
entre les divers opérateurs et MORPHEE se fera par 
l'intermédiaire de fibres optiques. 
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C2.3b Le u.-contrôleur : système chor_ muc 

La carte L-contrôleur est à l'origine dotée d'un mini- 
interpréteur de commande DSSEBUG qui permet: . 

- de visualiser le contenu de la mémoire en désassemblant 
éventuellement lorsqu'il s'agit d'une zone de code. 

- de faire de l'exécution contrôlée en mettant des points d'arrêt 
et en visualisant le contenu des registres. 

Cette configuration ne permettait pas de développer des 
applications complexes directement sur la carte. Il fallait 
développer des programmes (le plus souvent en C}) sous 
UNIX puis télécharger ces programmes par l'intermédiaire 
du VME et de la mémoire double accès de la carte. De plus 
aucune des primitives systèmes UNIX ne pouvait être utilisée 
car la carte ne possédait pas ce système. 

Les applications envisagées sur le L-contrôleur étant des 
applications de traitement d'images en temps réel devant 
fonctionner à la vitesse des signaux de synchronisation lignes 
et trames, il fallait envisager de développer un système 
temps réel. 

Comme de plus ce système devait être interfacé avec le 
système CHORUS de la SM90, nous avons décidé de réaliser 
un micro-système respectant le plus possible le mode de 
. fonctionnement de CHORUS et d'implanter en particulier les 
notions de porte et d'envoi de message, ainsi que la possibilité 
de déclencher une étape de traitement sur une interruption . 
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F.0. 


L'objectif fixé était simple: un acteur CHORUS pilotant une 
action sur le li-contrôleur devait avoir l'impression de 
dialoguer avec un autre acteur CHORUS. De cette manière, 
les personnes ayant l'habitude de développer sous CHORUS 
devaient pouvoir écrire facilement de nouvelles applications. 
Pour atteindre cet objectif, deux ensembles distincts ont été 
réalisés: 

- Un acteur CHORUS (FACTEUR) chargé de la 
communication avec le L-contrôleur. 

- Le système sur le L-contrôleur (SEB) et les primitives de 
communication avec le FACTEUR pour qu'un dialogue 
puisse s'établir. 

En outre il a fallu réaliser un programme de mise en oeuvre 
du SEB depuis CHORUS (phase de BOOT), ce qui comprend 
deux choses: 

1) Le téléchargement du SEB ainsi que son démarrage. 

2) La création simultanée de l'acteur FACTEUR. 

Ainsi, la personne souhaitant réaliser une nouvelle application 
pilotable depuis CHORUS doit faire deux choses: 

1) Ecrire un acteur CHORUS (pilote_appli) chargé de piloter 
des applications sur le L-contrôleur ( ou en reprendre un déjà 
existant ). 

2) Ecrire l'application sur le L-contrôleur (appli_muc). 
L'acteur pilote_appli fait une demande de création de 
l'application auprès du FACTEUR. Celui-ci vérifie la 
validité de la demande, puis dans l'affirmative télécharge 
appli_muc sur le hi-contrôleur. Si tout s'est bien passé, il 
renvoie à pilote_appli un identificateur de porte (p_com) qui 
lui permettra de dialoguer avec appli_muc. 

Pour faire parvenir un message (au sens CHORUS du terme) 
à appli_muc il suffit alors à pilote_appli de l'envoyer sur 
p_com. Le FACTEUR se chargera d'acheminer le courrier. 
De son côté, après avoir effectuer un traitement, appli_muc 
peut faire parvenir à pilote_appli un message en retour par 
l'intermédiaire des primitives systèmes du SÉB. Ce message 
parviendra sur la porte de pilote_appli qui a fait la demande 
de création d'application auprès du FACTEUR. 
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MORPHEE: A multi access memory unit for on the fly image 
processing applications 
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C2.4 Méthodes grammaticales et simulateur MEDCIN 
J.BLANC-TALON (Thèse (PARISXT)B. ZAVIDOVIQUE) 
La machine MEDCIN est un système multiprocesseur à forte 
granularité dont l'architecture est adaptée à une grande classe 
d'algorithmes de prises de décision. Destinée en un premier 
temps à l'étude, ses grands axes de conception sont les 
suivants. 

C2.4a Axes de conception 

1) Etude d'un ensemble de classes d'algorithmes. 

Il s'agit de choisir parmi un éventail de méthodes des 
algorithmes représentatifs de leur classe d'appartenance, afin 
d'étudier leur comportement sous l'aspect nombre 
d'opérations/ flot de données. On espère ainsi en dégager un 
dénominateur commun. 

On est ensuite à même d'inférer une première architecture 
comprenant ce facteur. | 

2) Validation de l'architecture choisie. 

On construit ensuite un simulateur correspondant à la 
première architecture choisie, ce qui permet d'en valider ou 
d'en infirmer tel ou tel sous-ensemble. Parallèlement, une 
première version de la machine est effectivement réalisée, on 
extrait de son couplage d'avec le simulateur des résultats 


numériques plus pertinents que ceux fournis par une 
simulation s'appuyant sur des bases purement virtuelles. 

3) Phase de développement. 

On dispose maintenant d'un noyau d'utilitaires qui comprend 
autour d'une version améliorée de la machine un système (ou 
un pseudo-système) et toutes les facilités de programmation 
en langage de haut niveau. 

L'incorporation de la machine dans le module HECATE 
permet à un groupe plus large d'utilisateurs de mettre en 
évidence certains points faibles de l'architecture. 


C2.4b Méthodes structurelles et méthodes grammaticales. 

On fait, parmi la classe des méthodes structurelles, le choix 
de la reconnaissance des formes par grammaires. Postulant 
l'insuffisance des grammaires régulières ou algébriques pour 
la reconnaissance de formes dans un contexte réel , on 
développe un type de grammaires à mi-chemin entre les 
grammaires d'arbres et les grammaires algébriques. Ces 
grammaires conduisent en quelque sorte à effectuer une 
"projection" de l'espace des arbres dans celui des chaînes, i.e. 
à supprimer la commutativité dans l'isomorphisme d'arbres; 
elles donnent naissance également à une autre différence 
fondamentale d'avec les grammaires d'arbres, illustrée par 
leur nom générique. 

On appelle ce nouveau type de grammaires Grammaires 
TLS (Tightly Linked Structures Grammars, Grammaires de 
Structures Fortes) et on développe les algorithmes de 
segmentation, d'inférence et de parsing inhérents à ces 
grammaires. On propose également l'application de ces 
grammaires à d'autres classes de problèmes étudiés au 
laboratoire. 

Toujours dans l'esprit MEDCIN, la réalisation logiciel des 
algorithmes se fait en parallélisant les opérateurs constitutifs. 
On espère donc ainsi implémenter plus rapidement 
l'algorithme sur le simulateur de la machine MEDCIN 

En accord avec notre schéma directeur, on réalise un 
simulateur de la machine destiné d'abord à valider les choix 
faits ou à faire dans la première réalisation effective de la 
machine. 

Le simulateur proposé, en voie de développement, comprend 
d'une part une couche logicielle permettant la programmation 
symbolique des différentes entités de la machine; cette 
couche gère les échanges entre ces entités, assure le dialogue 
avec l'opérateur et permet des modifications rapides de la 
logique interne de la machine. En dessous on trouve une 
interface avec la machine physique, qui lance les programmes 
spécifiques aux modules physiquement disponibles pour en 
extraire les résultats à valoir. Beaucoup plus spécialisée, 
cette interface nécessite des efforts plus importants surtout 
dans son caractère évolutif. 


C2.4c Implantation des premiers algorithmes sur le 
simulateur. 

Une fois le simulateur réalisé, on implante notre algorithme 
afin de tester les compromis faits dans la machine. Quels sont 
les résultats attendus ? 

Les méthodes grammaticales requièrent d'une part des tris 
mémoires importants et d'autre part un fort taux d'échanges, 
de faibles capacités, entre unités de calcul (donc a priori 
entre processeurs). On espère donc d'abord déduire une 
incidence importante de la décomposition d'un tel algorithme 
sur le réseau de communications nécessaire à un ensemble de 
processeurs. Ensuite, on tentera de montrer comment les tris 
en mémoire peuvent gagner en efficacité, ce au moyen de 
traitements connexes par un processeur demandeur. 

C2.4d Conclusion 

L'ensemble des méthodes développées pour l'implantation 
fonctionnelle des Grammaires de Structures Fortes trouve son 
aboutissement dans un ensemble d'articles en cours de 
rédaction, à proposer très prochainement. Un certain nombre 
de leurs concepts a été validé, la poursuite de la recherche 
continue, principalement pour la probabilisation (avec une 
approche d'ailleurs davantage orientée vers la théorie des 
ensembles flous) des grammaires inférées. 

Le simulateur, en cours de développement, devra réaliser une 
configuration symbolique minimale de la machine: son 
évolution se fera alors conjointement avec son utilisation. On 
peut d'ailleurs penser à une version plus évoluée entièrement 
remaniée, développée alors dans le cadre d'une autre thèse. 
L'implantation de l'algorithme devra en principe être assez 
rapide, puisqu'il s'agira simplement de distribuer un 
programme fonctionnant sur un ensemble de processeurs 
programmables en C. 


C2.5 Le concept spmd 

C.LEGRAND et P.MISSAKTAN 

L'une des voies actuellement explorées pour augmenter la 
puissance de calcul des ordinateurs est la parallélisation des 
programmes. Cependant, la gestion de cette parallélisation 
présente des difficultés. 

Pour tenter de poser le problème avec précision, le 
communauté scientifique utilise volontiers une classification 
due à FLYNN. Selon cette classification, les machines 
informatiques se répartissent en MIMD, SIMD et MISD. ( le 
dernier concept, qui concerne les techniques dites de "pipe- 
line” nous intéresse peu ici). 

Les ordinateurs MIMD (Multi Instructions Multi Data) ont un 
large domaine d'application. Ils sont en effet capables de 
traiter les graphes dans toute leur généralité. Cependant, ils 
posent des problèmes encore non résolus pour la 
formalisation de la synchronisation des communications. 

Par contre, la synchronisation des machines SIMD (Single 
Instruction Multi Data) est formalisable au prix d'une perte de 
généralité par rapport au MIMD. Ces machines sont, malgré 
tout, suffisamment générales pour couvrir les applications en 
calcul numérique où une structuration algébrique du problème 
posé facilitant le "synchronisme SIMD" est possible. Il ne 
faut donc pas s'étonner de trouver sur le marché un nombre 
important de réalisations industrielles de tels ordinateurs. 
Enfin, les machines SPMD utilisent un concept apparu lors de 
la création par le LASSI de la maquette OPSILA, destinée à 
développer et étendre le concept SIMD et les architectures ad 
hoc. Le terme SPMD est inspiré de FLYNN : SPMD signifie 
Simple Programme Multi Data ; l'entité unique n'est plus 
l'instruction, mais le programme. Une machine SPMD 
exécute en parallèle le même programme sur des données 
différentes, la synchronisation se faisant sur la fin de 
programme dont le temps d'exécution est le plus long. 

Toute communication est exclue pendant le déroulement des 
programmes. Les échanges nécessaires se font a postériori. 
On obtient ainsi un fonctionnement intermédiaire entre le 
SIMD et le MIMD. Les programmes sont plus indépendants, 
plus faciles à paralléliser que dans le SIMD, la 
parallélisation se faisant par découpage en sous-domaines et 
non en vecteurs. (Par exemple une matrice sera parallélisée 
non par décomposition en vecteurs, mais par découpages en 
sous-matrices) 

En résumé, le mode SPMD conduit à des architectures et à 
des logiciels moins complexes que le mode SIMD. La 
synchronisation en mode SPMD sera particulièrement simple, 
puisque toutes les communications inter-programmes seront 
gérées a postériori par un élément centralisé. En contre-partie 
de cette simplicité, on aura une perte de généralité, d'ailleurs 
déjà exhaustivement étudiée en informatique générale avec 
les mécanismes "fork and join" de CONWAY. Cette perte de 
généralité n'est d'ailleurs pas aussi étendue qu'on pourrait le 
craindre et des études menées au LASSY montrent que de 
nombreux problèmes, traditionnellement du ressort du SIMD, 
peuvent se transposer au mode SPMD. 

C2.5a Description d'un modèle de machine SPMD. 
Fonctionnement 

1) Architecture matérielle | 

Une machine SPMD appartient à la classe des architectures à 
forte granularité : 

La figure donne le schéma architectural d'un modèle possible 
d'une telle machine, comportant N Processeurs Elémentaires 
(P.E). On peut y distinguer les sous-ensembles suivants : 

1/ les processeurs élémentaires (P.E) et leurs mémoires 
locales (ML) 

2/ un processeur général (P.G) et sa mémoire générale (M.G) 
3/ un réseau à reconfiguration rapide qui, sous le contrôle du 
P.G, fait communiquer entre-elles les mémoires 

4] un ordinateur hôte, de structure conventionnelle 

5/ un bus de chargement des données et programme 

6/ des entrées/sorties performantes (mode DMA) qui 
permettent l'accès rapide et simultané (vol de cycle) à la 
mémoire générale et/ou aux mémoires locales. : 


7] divers aménagements nécessaires à la synchronisation, 


comme l'initialisation du mode SPMD, le ET de 


récapitulation des “fins SPMD", ou encore les indicateurs 


nécessaires à la gestion centralisée des DMA répartis. 
2) Chargement des données : 
C'est l'utilisateur qui répartit les données en sous-ensembles. 


Cette répartition dépend beaucoup de la nature du problème 
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Communications en mode SPMD 
dans un exemple d'architecture 
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posé. Comme les programmes, les sous-ensembles de 
données peuvent être chargés dans les mémoires locales, sous 
le contrôle de l'hôte, via le bus spécialisé de chargement. 
Mais dans certains cas, par exemple le traitement d'images à 
la volée, ou encore la synthèse d'images temps réel, des 
rafraîchissements rapides des données sont nécessaires. La 
communication des mémoires locales avec l'extérieur se fait 
alors en mode DMA. 

3) Architecture logicielle 

Une machine SPMD utilisera avec profit le procédé des 
processeurs virtuels, implantés sur les processeurs physiques, 
qui rend la programmation souple et indépendante de 
l'évolution matérielle. La machine comporte tous les 
aménagements classiques (initialisation, trace, debugg, 
logimétrie) auxquels sont adjointes des primitives permettant 
l'implantation des instructions "Fork and Join". Les logiciels 
sont résidants sur l'hôte et sur le P.G, avec noyaux receveurs 
sur les P.E quand nécessaire. 

Les programmes sont mis au point sur l'hôte, dans un langage 
de haut niveau dont la nature dépend beaucoup du domaine 
dans lequel travaille l'utilisateur (C, FORTRAN …). Il faut 
noter qu'en SPMD, les langages de haut niveau n'ont pas 
besoin d'être vectorisés, ce qui rend beaucoup plus facile 
qu'en SIMD la parallélisation des programmes. Celle-ci se 
réduit en effet à une répartition des données par domaines et à 
l'organisation des échanges a postériori entre ces domaines. 

Il suffit donc de traduire en code exécutable par les PE le 
programme mis au point sur l'hôte, puis de le dupliquer dans 
les mémoires locales. Les logiciels nécessaires sont beaucoup 
plus simples que les programmes vectoriseurs nécessaires en 
SIMD 

Le processeur général P.G remplit une fonction analogue à 
celle du processeur scalaire d'une machine SIMD. Il contient 
le corps principal du programme, formé d'imbrication 
d'entrées/sorties, d'échanges, et de modules de programmes 
SPMD. Le P.G joue le rôle de "chef d'orchestre" entre ces 
différentes fonctions. 


C2.5b Déroulement du programme 

Supposons les programmes chargés dans les mémoires de la 
machine. 

L'hôte initialise le corps du programme principal par une 
interruption communiquée au P.G. Celui-ci commence par 
commander le chargement des données dans les mémoires 
locales en mode DMA ; puis à la rencontre d'une instruction 
“début SPMD", les programmes résidant sur chaque 
processeur élémentaire sont activés. 

Les P.E exécutent alors chacun son module de programme 
SPMD, en des durées qui peuvent être variables, puisque les 
données, et donc les conditions locales de branchements, sont 
différentes. Chaque P.E s'arrête quand son programme est 
terminé, boucle, et positionne un indicateur. Quand 
l'ensemble des indicateurs est positionné, la partie SPMD du 
programme est achevée : on revient alors au programme 
principal. 

À ce moment, les résultats sont dans les différentes mémoires 
communes: le P.G configure alors le réseau pour réaliser les 
échanges nécessaires aux traitements terminaux (par ex, 
fusion en mémoire générale de sous-matrices en mémoire 
commune). : k 

[ C'est pour rendre plus efficace certains de ces traitements a 
postériori, que la mémoire générale est reliée à un noeud du 
réseau]. 

Le chronogramme de la figure résume le processus. On 
remarquera que l'utilisation de la technique des entrées/sorties 
DMA séparées permet de mener en mode "pipe-line" les 
échanges de données et les traitements a postériori. 

C2.5c Conclusion 

La relative simplicité structurelle des machines SPMD et la 
crédibilité de parallélisation qu'elles permettent, ouvrent des 
domaines d'application en traitement d'images et en calcul 
numérique. en concurrence avec le mode SIMD, qui 
conduit à des architectures plus complexes et à des techniques 
de parallélisation moins crédibles. 


C2.6 Extension COURBE 
TIZIQUEL (M.P. Gayrard) 
Les courbes, supports à des informations de types variés, sont 
d'utilisation fréquente en traitement d'images. C'est la raison 
pour laquelle le circuit "courbes", composant étudié 
Spécialement pour le déroulement, en temps réel, 


d'algorithmes d'extraction et de traitement de courbes 
élaborées à partir d'une image, a été conçu à l'ETCA. 
Les 2 fonctions de ce circuit sont donc : 
* l'élaboration de courbes : 

- des histogrammes calculés sur toute ou partie de l'image 

- des projections réalisées sur différents domaines de l'image 
(sur toutes les lignes ou toutes les colonnes) 
* l'analyse de ces courbes : 

- la recherche des valeurs extrêmes de la courbe 

- le tri associatif par valeurs croissantes de la courbe 
Les travaux effectués durant cette année, sur le projet 
"Courbe" ont été basés sur la réalisation de diverses 
applications : 

- dans un premier temps, des applications de test, 
destinées à prouver le bon fonctionnement de ce circuit, juste 
sorti des chaînes de fabrication : 

- puis dans un deuxième temps, une application 
majeure permettant la mise en oeuvre du circuit "courbes" 
dans la machine HECATE. 

Une plate-forme a donc été conçue pour recevoir ces 
différentes applications, cette plate-forme autorisant le: temps 
réel et permettant le passage direct d'architectures simples à 
des architectures plus complexes (à base de plusieurs circuits 
"courbes". 

Cette plate-forme comporte donc deux parties distinctes: 

* une partie commune à toutes les applications 
comprenant: 

- une interface avec le bus VME. 
permettant la mise en place d'un logiciel de contrôle de la 
carte 

- un bloc d'interface avec la source 
d'image (dans notre cas, le module d'acquisition CAPTIO) 

- deux générateurs d'adresses 

- deux mémoires d'images pour le 
stockage des images à traiter 

- deux mémoires tampons pour le stockage 
des courbes réalisées par le circuit 

- un générateur de courbes sur écran 

- un aïguilleur de signaux pour la 
composition de l'écran d'affichage (permettant la visualisation 
des courbes à l'écran en simultaneïté avec celle des images 
traitées) 

* une partie spécifique à chaque application, 
constituée d'un ou plusieurs processeurs “courbes” et des 
séquenceurs associés indispensables pour le déroulement des 
algorithmes et pour le contrôle des circuits 


C2.6a Applications de test 

L'élaboration d'histogrammes et de projections, en temps réel 
à partir d'une image 512x512, nécessitant l'utilisation d'au 
moins six circuits “courbes”. Il nous a été indispensable 
avant de développer de telles architectures, de tester le circuit 
sur des applications de taille plus petite telles que: 

- le calcul d'un histogramme en semi temps réel, 
d'une image 16x16 sur un flot discontinu, avec un seul circuit 
: dans ce cas, le circuit traite deux pixels sur quatre. 

- le calcul d'un histogramme en temps réel d'une 
image 16x16 sur flot discontinu, avec deux circuits: ici les 
deux circuits travaillent en entrelacement. Chacun traite deux 
pixels sur quatre. Lors du transfert des résultats dans les 
mémoires tampons, une accumulation est nécessaire sur les 
deux circuits. Une ALU d'un circuit est utilisée à cet effet. 

- le calcul d'histogramme en temps réel, d'une image 
16x16 sur flot continu, avec deux circuits : la différence avec 
la version précédente réside dans le séquencement global et 
permanent de l'architecture de la carte par opposition à un 
mode de fonctionnement pas à pas, facilitant la mise au 
point. 

La réalisation de ces architectures simples nous a prouvé le 
bon fonctionnement du circuit "courbe". 

Le succès de ces tests nous permettait de passer à une 
architecture plus complexe, employant six circuits. 

C2.6b Application majeure | 

Nous avions le choix entre l'élaboration d'un histogramme en 
temps réel sur une image 512x512 et l'élaboration de 
projections horizontales et verticales dans les mêmes 
conditions. | 

Nous avons choisi la deuxième fonction, celle-ci mettant en 
oeuvre un séquenceur ainsi que des chemins de données 
internes totalement différents de ceux testés précédemment. 
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En effet, dans ce cas, les circuits travaillent trois par trois : 
leurs ALUSs sont cascadées pour donner deux ALUSs de 24 
bits. 
Les trois premiers traitent les 256 premières lignes ou 
colonnes de l'image, selon qu'il s'agit d'une projection 
horizontale ou verticale, et les trois autres traitent les 256 
suivantes. Le traitement consiste à faire la somme des valeurs 
sur 8 bits des 512 pixels de chaque ligne ou colonne. Ainsi, 
la présence d'un objet sur l'image se traduit sur les courbes 
calculées, par une déformation positive ou négative, selon 
que l'objet est plus clair ou plus sombre que le fond. 
Ensuite le calcul du minimum de ces courbes, permet de 
transmettre au module CAPTIO, les adresses de la ligne et de 
la colonne la plus sombre de l'image. Ce qui lui offre la 
possibilité très intéressante de centrer et d'asservir une 
fenêtre de taille déterminée sur ces coordonnées, et d'obtenir 
dans le cas d'un mobile se déplaçant sur un fond uniforme, un 
suivi de cibles temps réel. 
Pour cette application, le séquenceur externe, bien que 
beaucoup plus complexe, que dans les cas précédents, a été 
défini par la même méthode : 

- écriture en assembleur circuit "courbe" des 
algorithmes 

- conversion de cet assemblage en tableaux de 
fonctions boolées | 

* table de transitions 
* table de commandes 
- compilation de ces tableaux sous forme de PLA 


C2.7 Mise au point du dialogue NYX-CAPTIO- 


COLISE 


P. HOFFMANN 

Le but recherché est un pré-test en vue d'appréhender 
correctement les diverses liaisons et interactions de la 
machine HECATE dans son ensemble. 

Dans cette optique NYX est utilisé non pas en tant 
qu'opérateur, mais uniquement en banc mémoire, permettant 
ainsi aux opérateurs de COLISE de pouvoir fonctionner et 
dialoguer entre eux, CAPTIO figurant ici la source d'images. 
Côté COLISE une carte d'interface a été conçue, qui permet 
d'aiguiller correctement, spatialement et temporellement, les 
informations provenant de NYX. Des aménagements ont 
également été réalisés sur NYX et CAPTIO. 

La synchronisation de l'ensemble est assurée par NYX faisant 
ainsi figure de "tampon" entre des modules possédant tous 
deux leur propre synchro fonctionnelle.Toutes les liaisons 
mises en jeu ont été réalisées par le biais des fibres optiques. 
C2.7.a Liaisons fibres optiques: 

Les fibres utilisées sont des fibres 50-125 multimodes. 
L'émetteur optique est constitué d'une diode GaAlAs à 820 
nm, le récepteur d'une photodiode PIN et d'un ampli faible 
bruit. Les pertes d'insertion sur la fibre sont comprises entre 2 
et 4 dB/Km: nos longueurs de fibres étant de 25 m, 
l'atténuation est très faible. | 

Le premier montage utilisé permettait la transmission de 
signaux dont les rapports cycliques avoisinaient les 
50%.Nous avons dans un premier temps effectué un codage 
Manchester de l'information. Les résultats, bien que probants, 
ne répondaient pas à une fiabilité totale; le montage d'origine 
a donc été amélioré pour respecter ce critère. 

Nous travaillons à l'heure actuelle en "monosignal", c'est-à- 
dire un signal électrique par liaison optique à une fréquence 
maximum de 50 MHz. Nous souhaitons multiplexer les 
signaux à l'entrée de l'émetteur par 4 voire par 8. Cette 
nouvelle liaison optique, dont les premiers résultats sont 
encourageants, permettra une vitesse de transmission de 200 
Mbits, réduisant ainsi considérablement le nombre de fibres 
utilisées. 





.J,b Etiqueteur de régi COLI 
L'Etiqueteur de régions est un opérateur qui traite à la volée 
les pixels lui provenant d'un opérateur de voisinage et leur 
attribut une étiquette; ainsi une même région doit-elle avoir 


une seule étiquette. Le synoptique de cet opérateur est le 
suivant: 
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Cet opérateur se veut le plus flexible et le plus convivial 
possible dans le but de lui implanter divers algorithmes. 
-Extension du voisinage autre que le L inversé de base. 
-Extension à la croissance de région par une table des 
minima. 

-Changement des traitements à effectuer sur les étiquettes 
grâce à des tables de transcodage. 

- Accès par soft à tous les niveaux. 

L'étiqueteur pour respecter les contraintes du temps réel a fait 
appel à une électronique très rapide notamment pour exemple 
des mémoires à temps d'accès de 15ns. Le taux d'occupation 
de la carte atteint les 100%. 

C2.7.c Carte "Crossbar” (MORPHEE) 

Cette carte est en fait un immense multiplexeur permettant de 
gérer toutes les liaisons entre les différents modules de la 
machine HECATE.La base électronique sera un crossbar 
AS8840, la gestion des timing étant assuré par des RAM 
statiques très rapides et des prédiffusés reconfigurables. 

Nous sommes à l'heure actuelle dans la première phase de 
conception. 


C2.8 Génération automatique d'automates de 
traitement d'image à partir de résultats d'émulation. 
H.SAFIR(Thèse(PARISXT)B.ZAVIDOVIQUE) 

C2.8a Introduction 

L'implantation systématique d'applications algorithmiques sur 
le matériel utilisant des langages de programmation 
conventionnels afin de transcrire des spécifications 
comportementales, n' a eu qu'un succès limité parce que le 
paradigme sous-jacent (type Von-neumann) de ces langages 
n'est bien adapté qu'au calcul séquentiel. Ce paradigme et la 
faiblesse d'expression de ces langages ont conduit à 
restreindre les modèles de conception VLSI à un champ 
d'alternatives limité. Des exemples caractéristiques sont 
Sycomore , Mac Pitts etc... ciblés sur une architecture de 
type microprocesseur. D' autres approches utilisant des 
langages comme OCCAM (spécifique aux traitements 
parallèles) ou basées sur le paradigme flot-de-données 
fournissent un environnement adapté à la représentation 
d'algorithmes parallèles, ce qui permet une plus grande 
souplesse et richesse dans le choix d'alternatives. Néanmoins, 
pour n'importe quel algorithme, il est difficile d'obtenir à la 
fois du parallèlisme et de la régularité, ce qui souvent impose 
une reformulation de l'algorithme. Par conséquent, des 
méthodes systématiques d'implantation d'algorithmes doivent 
être développées. Ces constatations ont, en partie, incité le 
laboratoire à expérimenter une approche tout à fait originale 
dans la synthèse automatique d'architecture et/ou 
l'optimisation des architectures de machines déjà existantes 
(pour un ou une classe d'algorithmes). 

L' originalité de cette approche se situe aussi bien dans le 
concept même de la compilation de silicium que dans la 
méthode utilisée à l'implantation du système. En effet, 

- au niveau du processus d'automation de synthèse 


d'architecture, la conception automatique d'automates de 


traitement d'image est réalisée à partir de résultats d'émulation 


d'une machine “mère” encore plus générale (donc moins 


adaptée à un traitement spécifique) dédiée au traitement 
d'image 
- au niveau implantation, prenant en compte les contraintes 


de l'application ( performance, coût, etc.) la méthode utilisée 
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pour la recherche d'une solution (architecture) dans l'espace 
de "Design" est basée sur le recuit simulé.( Les derniers 
résultats montrent la supériorité de cet algorithme par rapport 
aux plus récents développés à USC (Parker) et à Bell- 
Northern Research Lab (Paulin) (complexité en o(N2)) sur 
des exemples de tailles importantes sur l'ordonnancement de 
graphe qui est un problème NP-complet. (Des analyses 
numériques ont montré que la complexité du recuit simulé est 
en O(N) pour le problème de couplage de point dans l'espace 
euclidien (Lutton) . 

Par conséquent, l'optimisation systématique d'architecture est 
réalisée. Cette optimisation conduit à la conception au niveau 
architectural d'un automate "fils", mieux adapté, et cela à 
partir de deux fichiers: 

- la description matérielle de la machine émulateur. 

- le graphe flot-de-données ordonnancé à partir d'une 
fonction coût à minimiser, pondérée par les contraintes de 
l'application (performance, surface) 

C2.8.b Description du problème 

Cette recherche est basée sur une nouvelle approche rendue 
possible par la machine HECATE ou machine émulateur. 
Cette machine programmable, spécialisée en traitement 
d'image, est capable d'émuler un large champ d'application 
dans ce domaine. L'extraction et la concentration au niveau 
KT (transfert de registres) d'opérateurs, effectivement utilisés 
lors d'une session particulière, doit mener à la conception 
d'un automate "fils". Le programme de diagnostic espionne 
donc la machine HECATE et garde une trace des opérateurs 
matériels utilisés durant l'émulation en cours ainsi que le 
comportement dynamique du flot de données (cf. $ C3.5). 

Le point de départ de ce travail se situe en aval du 
programme de diagnostique. Précisons que cette "description" 
peut ne pas être adaptée au problème considéré c'est-à-dire 
qu'il faudra, d'abord, optimiser cette description pour que 
l'automate fils se soumette aux contraintes de l'application 
(problème considéré) 
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Schématique du système 


Les programmes sont implantés en "Flavors" un langage 
orienté objet basé sur le Common-Lisp (sur machine Lisp 
SYMBOLICS 3670). 

La représentation par un langage orienté objet facilite À la fois 
la description matérielle de l'émulateur et la conception de 
l'automate fils ainsi que les caractéristiques des modules et 
opérateurs de la base de données. C'est parce que toute cette 
connaissance est structurée et conservée sous forme d'objets 
que cela augmente la modularité et facilite l'addition, le 
remplacement ou l'éventuelle modification d'information. 

La FFT a été utilisée comme exemple parce que c'est un 
algorithme simple et très bien connu . Le filtre elliptique du 
5° ordre, beaucoup plus compliqué a été aussi utilisé comme 
exemple parce qu'il représente un "benchmark" et donc il 
permet une comparaison avec des systèmes existants. Mais, 
bien sûr, nous envisageons de traiter dans un avenir proche, 
des exemples de plus en plus complexes et spécifiques au 
traitement d'image, comme 

- e calcul de la fonction de convolution et plus généralement 
la détection de contour. 

- des opérateurs d'histogramme globaux, la transformation de 
Hough et plus généralement des opérateurs de textures, etc. 

Comme nous l'avons déjà stipulé dans l'introduction, le 


délicat problème de transfert d'une description 


comportementale à une description structurelle, exige un 


énorme lot de connaissance d'ingénieur, et jusqu'à présent, 
cette connaissance ne peut être facilement décrite par les 
techniques de représentation actuelles. Nous résolvons 
partiellement ce problème en le reportant sur la réalisation 
d'HECATE. Par partiellement, nous voulons dire limité au 
traitement d'image. 

Il est à rappeler que la conception d'HECATE a été envisagée 
pour les deux raisons suivantes: 

- Manque d'ordinateurs assez puissants pour émuler et simuler 
les divers traitements d'images en temps réel (à la volée). 

- existence de la décomposition généralisée du traitement 
d'image en différents opérateurs correspondant aux modules 
d'HECATE. 


Associative query at the microlevel using interconnection 
À. Safir, P. Kajfasz, F. Devos, B. Zavidovique 

2nd ICCA (Pékin) Juin 87 | 
Fresh connection 

À. Safir, P. Kajfasz, F. Devos, B. Zavidovique 

20th annual ASILOMAR Conf., Nov 87 

Automatic generation of specific image processing. 

A. Safir, B. Zavidovique | 

VLSI Signal Processing III - IEEE Press 88 


C2.9 Mod2mag : un système de dessin automatique de 
silicium 

N. PARIS 

C2.9a Motivations 

Le but de ce travail est de compléter l'environnement de 
dessin de circuits intégrés Magic, pour le rendre aussi 
complet que possible. Voici en quelques lignes les 
potentialités de ce logiciel : 

+ édition et gestion de layouts hiérarchiques, 

+ vérification des règles de dessin en ligne, 

° tassage interactif, 

* interface vers différents simulateurs, 

* routage intégré. 

Ce logiciel ne s'intèresse qu'aux aspects de dessin. Aucune 
facilité n'est offerte pour la conception et la validation d'un 
schéma avant son dessin. Ce logiciel est accompagné de 
nombreux générateurs. On peut citer pour mémoire : 

+ Tableaux logiques programmables, 

+ Mémoires vives et mortes, 

° Multiplieurs, 

* buffeurs, décodeurs et multiplexeurs. 

L'analyse de ces différents générateurs a montré que pour la 
plupart, ils n'étaient pas portables à la technologie de circuits 
que nous employons à l'ETCA: ils doivent être 
intégralement réécrits. 

Notre travail a démarré sur les deux constations suivantes : 
d'une part, il n'est pas possible de concevoir et valider un 
schéma sous Magic sans dessiner son layout au préalable et 
d'autre part les générateurs existants sont à refaire et 
s'intègrent très mal à une schématique. 

C2.9b age de descripti 

La solution commune à ces deux problèmes passe par 
l'utilisation d'un langage de description de hardware connu 
sous le nom de Model. Ce langage ressemble à un langage 
de programmation classique (if, while, manipulation de 
variables...) si ce n'est qu'il est destiné à la définition de 
schémas hiérarchiques. On peut définir des fonctions (qui 
représentent des assemblages de transistors) qui sont par la 
suite appelées en passant en paramètres leurs signaux d'entrée 
-Sortie ainsi que d'éventuels paramètres numériques. Ce 
langage a une puissance d'expression supérieure à celle d'un 
schéma, car il est possible de définir des objets génériques. 
Ce langage, dans sa définition originelle, ne tient compte que 
d'aspects purement électriques. Nous avons étendu sa syntaxe 
pour pouvoir spécifier la méthode de dessin de chaque partie 
du layout et indiquer comment on doit composer chaque 
assemblage de blocs. 

C2.9c Mod2mag : une vue d'ensemble 

Nous aïlons maintenant passer en revue les fonctionnalités de 
ce logiciel : x 

* Un débuggueur intégré facilite la mise au point des fichiers 
de source. 

* La description électrique du schéma permet la génération 
directe des informations nécessaires à la simulation. On peut 
mettre au point un schéma sans le simuler. Cette génération 
est suffisamment souple pour pouvoir s'adapter rapidement à 
n'importe quel simulateur. 
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° Un permier style d'assemblage est le pavage. Il consiste en 
la juxtaposition des blocs les uns à côté des autres suivant des 
directives de placement. Les connexions entre blocs ne sont 
pas assurées, à moins qu'elles soient induites par le contact 
des blocs. Un fichier est néanmoins généré pour donner au 
routeur de Magic les directives adéquates pour faire ce 
travail. Ce simple style peut être utilisé avec profit dans 3 
circonstances: 

+ La génération des cellules de base. Le système permet de se 
définir des cellules de bases paramétrables dont le dessin est 
assemblé en fonction des paramètres de chaque utilisation. 
On peut par exemple dimensionner à souhait les transistors 
d'un amplificateur pour s'adapter au mieux. 

+ La génération de macro-blocs, à savoir tous les générateurs 
de la famille de Magic. Des facilités de lecture de fichiers 
permettent de particulariser les mémoires mortes et les 
tableaux logiques. 

+ L'assemblage général du circuit, en laissant des canaux pour 
permettre au routeur de Magic de faire les connexions. 

+ Un deuxième style d'assemblage est la génération de la 
bordure du circuit. On peut déclarer certaines cellules comme 
étant des plots d'entrées-sorties, situés à la périphérie du 
circuit. Le système gère la bordure du circuit en choisissant 
entre plusieurs styles en vue de minimiser la surface totale du 
circuit. 


+ Le dernier style d'assemblage est un générateur de chemin 


de donnée. Muni d'une bibliothèque de cellules standards et 
des ordres de placement, le système va composer tout d'abord 
un pavage, puis effectuer tout seul les connexions entre les 
constituants, en se donnant de la place pour faire passer les 
fils. La réservation de la deuxième couche de métallisation au 
routage, permet des gains de surface très importants et rend 
ce générateur rudimentaire particulièrement compétitif. 

C2.9d Résultats 

Ce programme est maintenant en phase d'achèvement 
(rédaction de la documentation). Deux bench-marks 
importants ont été réalisés en vue de tester ce logiciel. 
Quelques 400 à 800 lignes de Model permettent de décrire 
des circuits de plusieurs milliers de transistors (5.000 et 
20.000). Il suffit de procurer au système les bibliothèques des 
cellules de bases. Le temps de compilation est inférieur à 
deux minutes.Deux circuits initialement dessinés à la main 
présentent une fois compilés des surfaces équivalentes : le 
générateur de chemins de donnée offre des densités de l'ordre 
de 2000 transistors par mm2. 

Le coût d'un générateur supplémentaire est très faible : 
aucune ligne de C n'est à écrire. Il suffit d'écrire de l'ordre de 
200 lignes en Model et de dessiner quelques cellules. A titre 
d'exemple, nous avons refait le générateur de PLAs en une 
seule journée. 

En conclusion, l'emploi de ce générateur permet des gains de 
l'ordre 50 à 95% sur le temps de conception général. Son 
caractère assez souple permet de concevoir aussi bien du 
digital que de l'analogique. 

C2.9e Travail futur 

Nous allons consacrer nos efforts à la fiabilisation de ce 
système et à la facilitation de son usage. Nous comptons 
développer les bibliothèques et les générateurs nécessaires. 
Nous envisageons de plus d'interfacer dans les deux sens 
Mod2mag avec un système de schémas. ù 


C2.10 Le calculateur Fonctionnel. | 

E. ALLART (Thèse (PARIS XT) B. ZAVIDOVIQUE) 
G.QUENOT 

Notre but est la réalisation d'un calculateur permettant 
l'implantation efficace d'un nombre important d'algorithmes 
de traitement d'images de bas niveau. Nous avons choisi une 
architecture à flots de données permettant un traitement de 
l'image à la vitesse d'échantillonnage des pixels. Cette 
machine est constituée par un réseau à maille carrée de 
processeurs élémentaires effectuant à la fois le routage et le 
traitement des données à la volée. Son architecture repose sur 
un parallélisme temporel (un processeur par opération de 
traitement, les pixels passent en série; l'ensemble peut se voir 
comme un seul grand pipe-line) par opposition aux machines 
comme la rétine ou la pyramide où le parallélisme est spatial 
(un processeur par pixel, les opérations de traitement sont 
effectuées en série). Cette machine ne comporte aucun 
programme ou contrôle global. La programmation est faite au 
_ niveau de chaque processeur élémentaire et le contrôle est 


effectué uniquement par un séquencement local par les 
données. | 

Le processeur élémentaire (PE) comprend des ports d'entrée- 
sortie bidirectionnels et des piles FIFO d'entrée et de sortie 
reliés par un réseau cross-bar. Ces piles et ces ports 
permettent les communications entre PE et l'aiguillage des 
données. Pour la partie traitement, le PE comprend une partie 
opérative (capable d'effectuer des décalages, additions, 
soustractions, multiplication et valeur absolues) et une 
mémoire de 256 mots de 9 bits pouvant être utilisée comme 
une pile FIFO. 

Les applications rencontrées en Traitement d'Image de Bas 
Niveau peuvent se décomposer fonctionnellement et 
hiérarchiquement en traitements élémentaires. En d'autres 
termes, toute application peut se représenter par un graphe 
fonctionnel orienté, dont les noeuds supportent les traitements 
élémentaires retenus, et dont les arêtes servent de canaux de 
communication orientés. Or, la présentation sous forme de 
graphe est l'expression la plus naturelle du fonctionnement 
d'une architecture à flot de données. L'adéquation au 
Traitement d'Image se révèle donc très profonde. Replacée 
dans ce contexte, l'appellation Calculateur Fonctionnel prend 
sa pleine signification. 


ALGORITHME: 

Y(n) = a.X(n+1) + b.X(n) + c.X(n-1) 
QPERATEURS FONCTIONNELS. 

D: (XC1) X(2)... K(n)) = (O X(1)...X(n-1)) 


id : (X(1) KXC2) ... KCn)) = (XC1) KX(2) ... X(n)) 
A: (XC1) KX(2)... K(n)) = (X(2) X(3) .. X(n) 0) 
Ka: (XC1) X(2)... K(n)) = (a.X(1) a.X(2) ... a.X(n)) 


+: (CKXC1) XC2) ... XCn)) (VC1) YC2) . .. YCn))) = 
(KC1)+YC1) X(2)+YC2) ...  K(n)+Y(n)) 


EXPRESSION FONCTIONNELLE. 


‘DEF F = +olxa o A, +olxb o id, xc o DI] 
(V1) YC2)... YGn)) = F: (XC1) XC2) ... X(n)) 








En outre, un graphe fonctionnel quelconque peut être 
transformé aisément en un graphe équivalent d'ordre 3 (au 
plus 3 arêtes par noeud). De plus, tout graphe d'ordre 3 peut 
s'implanter sur un réseau à mailles carrées (4-connexité) où le 
croisement des données est possible. Par sa régularité et sa 
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modularité, un réseau de processeurs carrés reliés en 4- 
connexité constitue donc une implantation naturelle et 
efficace, d'architecture à flot de donnée, destinée au 
Traitement d'Image. 

Par rapport à une architecture SIMD, le parallélisme est 
moins massif (une dimension temporelle au lieu de deux 
dimensions spatiales), en contrepartie, le calculateur s'enrichit 
de cararactéristiques indispensables: richesse fonctionnelle, 
simplicité de communication avec l'extérieur, souplesse 
topologique, programmation ergonomique. 

La programmation du calculateur fonctionnel bénéficie de 
développements récents sur les langages fonctionnels. Ces 
derniers expriment simplement le parallélisme potentiel des 
applications. D'autre part la notion de variable disparait, et 
avec elle, des transferts coûteux en mémoire. En outre, un 
apport sensible concerne des notions du type: équivalence 
entre programmes, simplification, preuve de fonctionnement , 
et automatisation de ces opérations. 

Pour chaque application (aspect statique), le séquenceur 
général d'une telle machine doit transposer le graphe 
fonctionnel équivalent, sur le réseau carré. Chaque 
processeur, capable de réaliser tous les traitements 
élémentaires retenus, se voit affecter l'un d'entre eux. Chaque 
connexion reçoit un sens de fonctionnement. Le placement 
optimal de graphe est un problème NP-complet, c'est-à-dire 
un problème considéré comme ïinsoluble, sauf par 
énumération. Les méthodes dites de "recuit simulé” peuvent y 
apporter des solutions sous-optimales efficaces. Néanmoins, 
considérer le graphe fonctionnel comme figé, est une 
hypothèse simplificatrice. En réalité, si l'on considère une 
application comme une classe d'équivalence sur les graphes, 
le problème plus général d'implantation optimale d'application 
sur le calculateur fonctionnel, présente un degré de 
complexité encore supérieur. 

Les choix généraux formulés jusqu'ici fournissent un cadre 
architectural et logiciel favorable. Mais la marge de 
manoeuvre du concepteur est encore considérable. Dans des 
limites physiques raisonnables (taille de machine, nombre de 
transistors par circuit), il convient désormais de rechercher le 
meilleur compromis global puissance-programmabilité. Vu la 
structure répétitive retenue, la définition du processeur 
élémentaire est déterminante. L'efficacité du Calculateur 
Fonctionne] repose donc totalement sur un compromis local 
(au niveau du P.E.) granularité fonctionnelle-capacité de 
communication-encombrement, où la programmabilité 
apparait de façon implicite. Abusivement peut-être, le terme 
de granularité fonctionnelle recouvre des notions comme la 
cascadabilité et la tranchabilité. 

Par souci ergonomique, il serait souhaitable que les 
opérateurs élémentaires, retenus pour l'implantation sur 
chaque P.E., aient une signification tangible en Traitement 
d'Image de Bas Niveau. Cela imposerait une granularité 
minimale, qui peut cependant se traduire par une disparité 
génante. En effet, un P.E. englobant de tels opérateurs risque 
de n'utiliser qu'une partie minime de lui-même pour réaliser 
chacun d'entre eux, entrainant ainsi un gaspillage inévitable 
de silicium par chute de rendement spatial. Donc, il peut 
s'avèrer nécessaire de simplifier les opérateurs élémentaires. 
Heureusement, les langages fonctionnels s'adaptent aisément 
aux problèmes hiérarchiques. Rien n'empèche d'exprimer de 
façon transparente les traitements d'image de bas niveau, par 
des sous-graphes utilisant des opérateurs plus simples. Le 
traiteur d'images manipulerait alors une couche logicielle 
microprogrammée, au lieu de travailler directement sur la 
machine physique. Du reste, une relative simplicité du P.E. 
n'est pas un handicap durant la phase de développement du 
calculateur fonctionnel. La pratique de la programmation 
permettra précisément d'identifier la granularité optimale à 
donner au P.E. (ceci serait beaucoup plus délicat avec un 
premier jet trop puissant). 

Seul le comportëment statique du calculateur fonctionnel a été 
abordé jusqu'ici. En réalité, le calculateur fonctionnel est 
potentiellement dynamique, dans la mesure où les 
fonctionnalités des P.E. pourraient évoluer durant une 
application. Cet aspect, pour l'instant ignoré, pourrait avoir 
des répercussions intéressantes. 

Enfin, le calculteur fonctionnel, dans ses aspects statiques, 
ouvre la voie à l'automatisation de l'intégration des automates 
embarqués de Traitement d'Image. En effet, il est 
_ parfaitement envisageable d'associer automatiquement des 
cellules précaractérisées élémentaires sur un circuit, pour 
implanter une application donnée, définie par sa. 





décomposition fonctionnelle sur les opérateurs élémentaires 
représentés par chacune des cellules. En outre, le réseau carré 
et la 4-connexité "colle" parfaitement à la topologie d'un 
circuit VLSI. 

Les perspectives de développement ultérieur sont trop riches 
pour être précisées aujourd'hui. On citera néanmoins la 
possibilité d'intégration WSI (Wafer Scale Integration), 
puisque la structure du Calculateur Fonctionnel apparaît très 
tolérante aux pannes (P.E. défectueux). 


Functional Image Processing through Implementation. 
E.Allart, B.Zavidovique 

20th annual ASILOMAR Conf., Nov 87. 

Image processing VLSI Design through functional... 
E.Allart, B.Zavidovique - IEËÉE ISCS Helsinki Juin 88 
Functional computer for low level image processing 
E.Allart, B.Zavidovique - 9th ICPR Rome Oct 88 
Functional VLSI design for Image Processing IC 
E.Allart, B.Zavidovique 

22nd ASILOMAR Conference Oct/Nov 88. 

Functional mapping for low level … 

E.Allart, B.Zavidovique 

Monterey, Ca - Nov 88 et VLSI Signal Processing INT IEEE 
PRESS 


C2.11 Rétine et b-codage neuronal 
T.BERNARD, (Thèse (Paris XI) F. DEVOS) B. Zavidovique) 
P.GARDA (IEF Orsay) 


C2.11a RETINE : principes fondateurs. 
Des dix dernières années écoulées, la communauté 
scientifique en Traitement d'Image dégage une forte disparité 
des traitements successifs comme des objets traités, qui 
interviennent dans un processus traditionnel de vision. Dans 
ce contexte, la réalisation et la programmation de machines 
de vision efficaces, deviennent des gageures. Pour pallier ces 
difficultés, une voie prometteuse consiste à imposer, 
d'emblée, un cadre restrictif et unificateur aux objets et 
traitements, pour garantir a priori la simplicité de 
l'implantation matérielle et l'efficacité de programmation 
futures, quitte à particulariser le type de vision engendrée. 
Le projet de "Rétine" est l'aboutissement d'une telle 
démarche. La rétine repose sur un seul type de données, le 
plan de bits (image binaire), et sur une famille unique et 
complète d'opérateurs, les Traitements Combinatoires Locaux 
(TCL = fonctions logiques invariantes par translation, 
appliquées aux pixels d'images binaires). L'implantation 
architecturale retenue est de type cellulaire (privilégiant les 
communications interprocesseurs), et constituée par un 
tableau SIMD de processeurs TCL élémentaires (un par pixel) 
communiquant avec leurs quatre voisins immédiats. 
Afin de s'affranchir du goulot d'étranglement classique que 
constitue les échanges de données vers l'extérieur, 
l'acquisition de l'image binaire à traiter est l'objet d'un procédé 
optoélectronique massivement parallèle, intégré au tableau de 
processeurs TCL. Ainsi, la rétine repose sur un circuit VLSI 
monolithique, combinant des capteurs optoélectroniques 
(photodiodes, phototransistors), un procédé de binarisation 
(représentation biniveau d'un signal multiniveau = B-codage) 
et la mise en oeuvre de l'algorithmie TCL par des 
processeurs minimaux. 
Ce capteur intelligent doit permettre l'élaboration d'une vision 
fruste, autonome et rapide, dite “vision précoce" 
(particulièrement adaptée aux fonctions d'alarme et de 
poursuite). L'appellation "rétine" trouve sa justification dans 
l'analogie avec l'organisation de certaines visions animales. 
C2.11b De la scène observée à sa représentation binaire 
Dans le contexte rétinien, il est nécessaire de traduire les 
informations analogiques multiniveau d'une scène réelle, 
acquises par les photodiodes, en des densités locales de pixels 
binaires allumés (mis à 1). Un tel procédé, convertissant les 
images analogiques échantillonnées en images binaires, est 
appelé procédé de B-codage. Ses caractéristiques (fidélité aux 
niveaux de gris initiaux, homogénéité, restitution des 
fréquences spatiales, …) sont déterminantes, par leur 
influence sur la construction des traitements rétiniens à 
appliquer. | 
Divers procédés, permettant une implantation parallèle 
intégrée à la rétine, sont envisagés: 

* B-codage à matrices de seuils (Bayer) : une 
répartition périodique de plusieurs seuils de commutation 
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échelonnés linéairement permet de conserver simplement une 
information multiniveau. 

* B-codage à inhibition latérale : La commutation 
d'un pixel binaire inhibe celle de ses quatre plus proches 
voisins, d'où une réponse graduelle en fonction de l'intensité 
lumineuse incidente. 

* B-codage neuronal : un procédé neuronal 

analogique minimise une distance entre l'image multiniveau 
acquise par les photodiodes, et l'image binaire résultante 
convolée par un noyau variable. 
Moyennant un coût d'intégration additionnel modique, le 
procédé de B-codage neuronal conduit au meilleur compromis 
entre la fidélité en niveau de gris et la résolution spatiale. (cf. 
$ C4.11) Les caractéristiques principales de ce procédé sont 
décrites dans la section suivante. | 


C2.11c B-codage neuronal 

1) Critère d'optimisation et optima locaux. 

De par l'architecture de la "rétine", en chaque site rétinien, 
repéré par un indice bidimensionnel k € Z° : 


- Un pixel analogique X(k) e [0,1] est reçu du capteur 
optoélectronique. 

- Un pixel binaire B(k) e {0,1} doit être produit pour être 
traité par l'algorithmie TCL. 

Une densité locale de pixels allumés sur l'image binaire B 
(permettant l'évaluation des niveaux de gris) s'assimile 
mathématiquement à une convolée de B par un noyau de 
convolution K judicieusement choisi : K*B. 

Ainsi, la minimisation d'une distance arbitraire entre l'image 
binaire convolée K*B et l'image analogique initiale X 
constitue une méthode de B-codage. Le choix d'une distance 
donnée dépend de l'aptitude à en implanter facilement la 
minimisation. À ce titre, le caractère énergétique de la 
distance quadratique entre images, permet une implantation 
neuronale réalisant la minimisation de l'énergie E 
correspondante : 


E = 1/2 Z[[EKG-).B()]-X(j)]2 = 1/2 (K*B-X).(K*B-X) 
1 


J 

(1) 

Dans un espace d'une telle dimension, les minima globaux 
sont très difficilement accessibles; une minimisation de type 
neuronal fournit uniquement un minimum local de E, ce qui 
est en réalité un problème mineur, dans la mesure où le B- 
codage est une transformation elle-même essentiellement 
locale. Les minima locaux (du premier ordre) sont 
caractérisés par une remontée énergétique lorsqu'un pixel 
binaire quelconque est modifié. Grâce à quelques 
transformations algébriques, les minima locaux de E 
apparaissent comme points fixes de l'équation d'évolution (2) 


B — HinV(K#K (0) 0 [K*(K*B-X)]. (2) 
où Hinv est un opérateur d'inversion à hystérésis dont l'entrée 


est analogique centrée sur 0 et dont la sortie est binaire (0 ou 
1). 


Hysteresis 
Inverter 
Symbol. 





Rétine et B-codage neuronal 

T. Bernard, A. Reiïchaart, B. Dugas, B. Zavidovique, H. 
Rodriguez, P. Garda, F. Devos 
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Design of a half-toning integrated circuit... 

T.Bernard, P.Garda, B.Zavidovique, F.Devos 

1988 IEEE ISCS, Helsinki Juin 88 

À family of analog neural half-toning techniques 

T.Bernard, P.Garda, A.Reichart, B.Zavidovique, F.Devos 
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A diffusion based edge detector 
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C3. Architecture logiciel 


C3.1 Structure informatique de la machine HECATE 
D. IRLANDE 

C3.1a Généralités 

L'évolution et la prise en compte des extensions de la 
machine HECATE ont conduit à un renforcement important 
des moyens informatiques de commande et de contrôle. 
L'aspect multiprocesseur a été complété par l'introduction 
d'une seconde machine quadriprocesseur en charge du 
contrôle des nouveaux modules câblés de traitement d'images 
(Sous-ensemble courbe, Colise, Morphée). 

Du côté utilisateur , un poste graphique couleur haute 
définition présente les différents modules d'opérateurs câblés 
avec leurs possibilités de traitement, tout en acceptant de 
manière performante les techniques de l'intelligence 
artificielle nécessaires à la mise en oeuvre de cette interface. 
L'ensemble des machines informatiques communique via un 
réseau local Ethernet dédié et grâce à des services implantés 
au dessus du protocole TCP/IP. 

Le poste graphique (SUN 3/620) assure la fonction 
"passerelle réseaux", il permet les communications et les 
transferts entre le réseau informatique global du laboratoire et 
l'univers d'application de la machine HECATE. 

Les machines multiprocesseurs (SIM90) sont multisystèmes 
d'exploitation. Elles fournissent sur un processeur le système 
UNIX qui prend en charge les communications sur le réseau, 
et sur les autres processeurs le système réparti temps réel 
CHORUS qui assure l'interface avec les modules câblés. 
C3.1b Logiciels de communication et systèmes 

Les communications inter-machines sont effectuées sur la 
base d'échanges utilisant les "sockets" du système UNIX 4.2 
bsd. Cette interface, au dessus de la couche transport des 
réseaux, généralise les communications entre process locaux 
ou distants. 

Ces nouveaux services sont accédés sous TCP/IP par 
l'intermédiaire de numéros de ports qui interviennent en 
complément de l'adresse Internet de la machine destination. 
Les relations sont du type Client/Serveurs en mode flots 
d'octets par circuit virtuel. 

L'interface de communication et de routage, sur le poste 
graphique SUN, agit en tant que client, tandis que les 
serveurs de communications sur SIM90 réalisent l'interface 
avec le système CHORUS par le biais d'appels système 
développés pour la circonstance. 
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C3.1c Sous-système de contrôle 

L'utilisation d'une carte microcontrôleur "intelligente" liée à 
un module câblé de traitement d'images s'avère intéressante 
pour résoudre des problèmes locaux demandant un traitement 
particulier avec des temps de réponse très courts. 

Afin d'intégrer d'une manière la plus souple possible les 
possibilités d'un tel contrôleur, il a été nécessaire de 
développer un microsystème respectant le mode de 
fonctionnement de l'exécutif CHORUS qui pilote le module 
(notions de messages et de portes). 

Les moyens mis en oeuvre sont l'écriture, côté CHORUS, 
d'une entité exécutive (acteur }, appelée facteur, qui 


communique avec un système d'exploitation de base (SEB) 
côté microcontrôleur. 

Le facteur dialogue avec le système d'exploitation de base par 
l'intermédiaire d'une mémoire double accès située sur la carte 
microcontrôleur. Il vérifie la cohérence des créations 
d'applications. Il effectue le téléchargement des programmes 
sur la carte. [1 transmet les messages venant des acteurs 
CHORUS en le signalant par l'envoi d'une interruption qui 
active la scrutation de la mémoire double accès . 

Le système d'exploitation de base fournit des primitives 
système concernant la gestion des portes de communications, 
la gestion des interruptions, la gestion des Entrées/Sorties de 
la carte. Il renvoie des messages vers CHORUS en sollicitant 
l'acteur facteur après envoi d'une interruption. ' 

La mise en oeuvre d'une application sur la carte 
microcontrôleur consiste à créer un acteur qui demande la 
création d'une application au facteur, ce dernier renvoyant en 
réponse une porte de dialogue. 

Afin de permettre la localisation effective de la carte 
microcontrôleur dans le châssis du module de traitement 
d'images, il a été nécessaire d'employer un déport de bus 
appelé bus vertical. Ce bus est vu comme une extension 
logique du bus local VME de la machine multiprocesseur de 
contrôle. Il permet le transfert d'informations à distance d'une 
manière transparente grâce à une carte émettrice côté SIM90, 
et deux cartes réceptrices à chacune des extrêmités du bus 
vertical. 





Pilote - appli 1 





C3.1d L'informatique au laboratoire SP 

L'interconnexion des machines informatiques via un réseau 
est désormais une des clés permettant l'intégration et le 
partage des ressources liées à ces matériels (fichiers, 
imprimantes, accès réseaux distants, messagerie, archivage, 
BiCus) | 

Le support de transmission principalement utilisé est le câble 
coaxial Ethernet à 10 Mbit/s. Le choix du protocole TCP/IP 
s'est imposé par sa disponibilité quasi universelle sur 
l'ensemble des machines informatiques disposant d'une 
interface Ethernet. 

Les terminaux, dans chaque pièce du laboratoire sont reliés, 
via des tableaux à commutation manuelle, à des 
concentrateurs de lignes asynchrones (systèmes Bridge) 
possédant un accès Ethernet. Toute machine sur le réseau est 
ainsi accessible depuis n'importe quel terminal. 

Les différents services réseaux actuellement disponibles sont 
les suivants: 

- l'exécution de commandes de base (ftp, telnet, rsh, rlogin, 
rcp, etc...) réalisées grâce à un process serveur (démon) 
localisé sur une machine distante. 

Le partage de fichiers assuré par NFS (Network File System) 
qui permet aux différents utilisateurs d'accéder d'une manière 
transparente à des fichiers ou des partitions de disques sur des 
machines distantes. 

Le partage des imprimantes qui autorise l'impression d'un 
texte local sur une imprimante rattachée, à une machine 
distante. 

L'accès à d'autres réseaux via Transpac par une ligne 


spécialisée à 9600 bits/s 


Les échanges de courrier grâce à l'adhésion au réseau de 


messagerie FNET qui permet d'atteindre via Internet les 


messageries de tous les réseaux mondiaux. | 
L'intégration des Maclntosh et des compatibles IBM-PC doit 
se faire en mode client dans le réseau afin de profiter des 
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moyens de stockage et des matériels d'impression 
performants. 

Les compatibles IBM-PC sont connectés grâce à des cartes 
Ethernet 3-com et le logiciel PC/NFS de SUN. 

Pour le réseau Appletalk plusieurs solutions en cours 
d'évaluation (carte Ethernet sur un Macintosh utilisé en 
passerelle , "boîte noire" Kinetics ou Gatorbox). 

A mesure des évolutions, plusieurs concepts restent à 
généraliser: 

- les sous-réseaux pour les serveurs et les postes de travail 
sans disque. 

- le protocole de description graphique de fenêtrage X- 
Window (X11) pour les terminaux "bit-map” 

- le standard Postcript pour les impressions et les applications 
graphiques. 

- l'introduction des protocoles de communication ISO/OSI 
selon leur disponibilité sur les machines. 


C3.2 COUETCH 

J.P. NICAISE (S.DACIC) 

la Communication entre Unix, EThernet et Chorus dans 
Hécate. 

L'ajout de nouveaux modules spécialisés a porté les logiciels 
de contrôle à un niveau tel que les problèmes de routage des 
communications de base devaient leur être transparent. 

C3.2a Genèse. 

Tout d'abord, l'interface entre les systèmes Unix et Chorus 
devait être standardisée. Ainsi, le programme de bas niveau 
UnToCh (Unix To Chorus), utilisant les bases de 
communications déjà existantes, a été créé pour assurer les 
transferts de données bidirectionnels de manière saine et 
efficace. La création et la suppression d'acteurs sous Chorus, 
l'envoi d'un message à l'un d'eux depuis Unix et la réception 
d'un message envoyé à une structure Unix par un acteur pour 
accéder à des données image sont ainsi facilités et, surtout, 
standardisés. 

L'étude des modules spécialisés et la création de nouvelles 
macro-fonctions nécessitaient un outil puissant permettant un 
accès aisé et rapide aux opérateurs élémentaires déjà définis. 
Nous avons donc rassemblé ces fonctions dans la bibliothèque 
“Biblix”, les mettant ainsi à la disposition d'un utilisateur 
n'ayant plus à effectuer qu'un simple appel à une fonction en 
langage C, toute la partie communication, de gestion des 
acteurs et des erreurs étant assurée par UnToCh. 

C3.2b Le concept multi-machines 

Mais l'avenir du projet Hécate repose maintenant sur un 
concept multi-machines : une station de travail SUN ayant 
accès aux modules connectés sur deux SIM 90 “Chorix” via 
un réseau Ethernet local. Il suffisait donc d'étendre le principe 
de transparence Unix / Chorus à Unix / Ethernet / Chorus. 
Chaque machine “Chorix” possède donc une version étendue 
de UnToCh acceptant des messages depuis le réseau et les 
transférant dans le système Chorus. Un ROuteur de 
Communications sur EThernet (ROCET) effectue l'interface 
entre la station SUN et le réseau, assure le codage des 
messages et réalise la différenciation entre les deux “Chorix”. 
Enfin, la bibliothèque Biblix, transférée sur la station SUN, 
utilise RoCEt pour communiquer avec UnToCh. 

Les logiciels de commande de la station SUN, qu'ils 
sexécutent sous Le_Lisp ou en langage C, ont donc 
maintenant accès à toutes les fonctions de traitement d'image 
offertes par les modules spécialisés des deux machines 
“Chorix”, et ce de manière tout à fait transparente. 


| Station "SUN" 


Machine ‘"Chorix" 











Ethemmet 


Acteurs 
Chorus 


C3.3 Interface d'aide à l'utilisateur de la manip VO sur 
terminal graphique SUN. 

Ch. ROSNOBLET (S.DACIC) 

Cette interface déjà existante sur le terminal STEP a pour but 


de commander les modules de la version VO de la machine 
H.E.C.A.T.E. 


108 


Comme sur le terminal STEP l'interface est basée sur un 
système multi-fenêtres haute définition, mais pour le rendre 
plus souple et plus simple du point de vue de l'utilisation et de 
la programmation, nous avons choisi de développer cette 
interface à l'aide de l'environnement de développement 
d'application graphique AIDA. Celui-ci est bâti autour d'un 
langage de description d'image qui réduit la programmation 
de l'interface à l'assemblage de composant élémentaire 
(boutons, éditeurs de lignes, compteurs, menus, etc.) dont il 
suffit de définir les réactions à la souris. AIDA est 
entièrement programmable en Le-Lisp ce qui le rend 
extrêmement puissant et facilement extensible. 

Pour l'utilisateur, l'interface se présente sous la forme du 
synoptique général de l'architecture à commander. Chaque 
module de celui-ci est sensible et le fait de cliquer à l'intérieur 
d'un module déclenche l'ouverture d'une fenêtre qui représente 
le synoptique interne du module. Chaque zone de ce nouveau 
synoptique répond à la souris par une présentation de 
documentation concernant la zone sélectionnée. Cette 
documentation est en fait une zone d'hypertext permettant 
d'accéder aux fonctions de commande ou de paramètrage 
directement grâce à des mots sensibles” du texte. Les 
paramètres des fonctions ainsi activées sont représentés sous 
la forme de compteurs pour les variables numériques et sous 
la forme de sélecteurs de chaînes pour les variables 
alphanumériques, ceux-ci étant tous accessibles directement 
par la souris , l'utilisateur ne se sert plus du clavier ce qui 
rend l'interface très conviviale et d'un emploi très intuitif. 
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C3.4 GATTRI (Générateur 
Traitements Temps Réel d'Images) 


S.DACIC((Thèse ( PARIS XI) C.FLUHR) B.Zavidovique) 
Le projet GATTRI consiste à essayer de "plaquer” des 
algorithmes de traitements d'images sur des architectures 
MIMD (Multi Instruction Multi Data). HECATE et plus 
particulièrement COLISE constituent des bancs d'essais 
regroupant la plupart des problèmes rencontrés dans ce type 
d'architectures. Les premières versions de GATTRI sont 
testées sur le module COLISE qui est MIMD et qui 
As à une machine VLIW (Very Large Instruction 
ord) 
L'environnement de GATTRI peut être schématisé suivant le 
schéma ci-contre. 
C3.4a Description 
Le flot d'entrée du programme GATTRI correspond soit à des 
traitements déjà implantés une fois sur la machine 
(bibliothèque ) soit entrés par l'utilisateur (CAO) soit encore 
sous forme fonctionnelle. Le but de l'acquisition de ce flot 
d'entrée est la création d'une structure d'objets interconnectés 
qui représentent l'algorithme que l'on veut implanter et qui 
devient surtout la base de données sur laquelle le système va 
travailler. 
Notons ici qu'il ne nous appartient pas de vérifier la 
cohérence du traitement voulu au sens du traitement d'image, 
ni la possibilité d'implanter une fonction inconnue à partir de 
celles qui sont disponibles sur COLISE . GATTRI n'est pas 
ün programme d' expertise en traitement d'image. 
Son problème majeur à résoudre est celui des ressources : en 
effet, même si COLISE est une machine puissante aux 
opérateurs nombreux, un programme de traitement d'image 


d'Application de 





est rarement réalisable en une seule fois sur cette machine. 
On doit donc fragmenter le traitement en plusieurs phases en 
intercalant la mémoire d'image qu'offre le module 
MORPHEE. 
Ce découpage doit tenir compte de paramètres d'optimisation 
et de ressources machine: la mémoire n'est pas infinie, et le 
traitement d'image est un gros consommateur de celle-ci, 
certains algorithmes réclament plusieurs ressources 
opératoires en parallèle au même moment.(ex : Hollander ) 
Comme il est illusoire de vouloir intégrer d'un coup tous les 
paramètres d'optimisation intervenant dans un tel découpage, 
on fournit un ensemble d'outils automatiques sous-optimaux 
mais qui donnent une implantation correcte et on essaye 
d'intégrer les règles d'implantation futures grâce d'une part : à 
des outils conviviaux de visualisation des performances de 
l'implantation et d'autre part un mécanisme souple d'activation 
de méta règles d'implantation issues de plusieurs de ces 
observations. 

Un exemple d'outil de visualisation de performances est celui 
du graphique interactif de l'occupation en mémoire : Une 
implantation d'un algorithme, découpée en phases successives 
suppose un stockage de résultats intermédiaires (images ou 
morceaux d'images). L'accumulation de ces résultats 
(représentés par une courbe } évolue et est rendue sensible à 
l'écran. On peut à tout moment savoir quels sont les 
opérateurs responsables d'un surcroît d'utilisation de la 
mémoire. On peut alors décider ou non d'une autre stratégie 
d'allocation. S'il se dégage avec l'expérience, un véritable 
mécanisme de prévision, on l'implantera sous forme de règle. 
La boucle principale du schéma représente ce jeu d'allers et 
retours entre les programmes de découpages (qui doivent 
respecter l'ordre des calculs), les outils d'analyse de 
performances et les contraintes statiques et dynamiques de la 
machine hôte. (la mémoire disponible à un moment donné est 
une contrainte dynamique.) 

Enfin, quand un plan d'action satisfaisant est disponible, 
même sous-optimal du point de vue exploitation, on peut 
traduire les sous-graphes obtenus sous forme de mots de 
commande en extrayant les renseignements des facettes des 
objets opérateurs et conditionner leur envoi au module 
COLISE par la structure globale du graphe. (On ne passe 
d'une phase à l'autre que sur certitude de l'intègrité des 
résultats intermédiaires en cours de sauvegarde en mémoire). 
C3.4b Les concepts 

Notons que ce genre de problème est strictement identique à 
celui de la conception automatisée de circuits performants ou 
même l'expertise automatique (systèmes experts) est tenue en 
échec. Les critères d'optimisation, déjà fort nombreux et 
variables pour un circuit, sont très difficiles à coder 
individuellement (expertise) et leur interaction précise n'est 
même pas connue à ce jour. (Un boîtier remplacé par un autre 
dans une carte pour cause de consommation, par exemple 
peut influer sur le timing général et ce à l'autre bout de la 
carte.) 

Dans le cas présent, l'approche GATTRI permet de servir 
deux buts : 

D'une part, la commande de COLISE et son évaluation dans 
le cadre de la commande de la machine HECATE entière. 
D'autre part, l'approche d'un système d'évaluation des 
performances atténdues de l'intégration d'un processus de 
traitement d'image sous forme embarquable. 

En effet, avant même la phase de dessin précis de la structure 
de des constituants d'un circuit intégré ou d'une carte, on peut 
entreprendre très tôt l'étude globale du comportement de 
l'algorithme à intégrer du point de vue trafic mémoire ou de la 
répartition de la charge de calcul. L'assistance de l'ordinateur 
dans ce genre de tache commence seulement à émerger en 
conception classique (Simulateurs comportementaux de haut 
niveau, qui apparaissent dèjà comme les seuls outils capables 
de donner une réponse au problème des très gros projets.) 

La préévaluation intéractive des performances permet la 
remise en cause de l'algorithme ou de son implantation 
suivant des critères majeurs pour l'intégration. Cette remise 
en cause est en général très difficile à assumer en conception 
classique parce que trop coûteuse si le projet est très avancé, 
qui plus est dans le domaine du traitement d'image où la 
charge représentée par les simulations interdit toute erreur 
grave en début d'étude. 

C'est justement un des aspects capitaux du projet HECATE : 
_ Condenser au maximum les phases de définition d'un 
traitement d'image, de simulation (remplacée par l'émulation 


d'où gain de temps) et de spécification de la forme intégrée de . 
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ce traitement et automatiser cette conception pour la rendre 
auto-incrémentale. 

La mise en oeuvre des outils de GATTRI représente donc un 
lien crucial entre le concept d'émulateur pour la conception 
d'automates et la définition d'un véritable outil capable de 
franchir un pas decisif dans le problème posé par 


l'intégration de très gros circuits très complexes. 


C3.5 Diagnostic de fonctionnement d'un dispositif 
informatique complexe. Application à la machine 
HECATE 
T.BOMMART((Thèse(PARIS XI) C.FLUHR) 
B.Zavidovique) 
Pendant l'année 87, nous avons essayé de poser clairement 
les problèmes du diagnostic, de dégager les principales 
questions qu'il soulève et de définir les orientations de la 
recherche à mettre en oeuvre: { 

- les langages de description VLSI, les logiciels 
d'intégration d'une part, et d'autre part approche de la théorie 
des graphes et des hypergraphes 

- des systèmes de diagnostic de panne et de 
représentation de l'activité d'une machine et des problèmes de 
commande répartie, d'optimisation et de systèmes distribués 
coopératifs. 

L'année 88 à apporté des réponses et ce, par synergie entre 
les domaines d'études précités ainsi qu'avec l'approche 
GENSIM et la spécification du logiciel GATTRI de 
commande répartie du module COLISE. 

Rappelons d'abord les principaux problèmes soulevés par les 
premières approches du diagnostic, ainsi que l'impact des 
études plus particulièrement entreprises dans les domaines 
précités : 

L'étude de plusieurs langages de description VLSI et de 
logiciels de conception et d'intégration a permis : 

De dégager des constantes quant aux représentations en 
netlists ou langages à registres de transfert. 

D'analyser où prennent place les hiérarchies dans un circuit , 
leur formulation et leurs inconvénients. 

D'aborder les aspects économiques du problème de la 
Conception assistée de circuits VLSI: (coût humain de 
formation, de gestion des programmes, matériel sophistiqué 
et performances actuelles en conception automatique.) 

Pour ce qui est des systèmes VLSÏ, la plupart, architecturés 
autour de bases de données de composants, aident à 
construire une structure cohérente de circuit, soit en ligne 
pour les plus performants soit par compilation et utilisent des 
langages intermédiaires entre les différentes phases de 
conception. La mécanique de base utilisée, très souvent 
obscure parce que résultant de l'accumulation de plusieurs 
logiciels au cours des années est peu maniable, et fort 
difficile à étendre à d'autres types d'utilisation. 

Beaucoup de ces systèmes en effet sont lourds à mettre en 
oeuvre, naturellement bogués de par leur taille et réclament 
un temps prohibitif de gestion des innombrables fichiers qui 
les accompagnent. 

Une des causes majeures de ce manque de souplesse a trait à 
la nature même des langages utilisés : 

Ces programmes utilisent souvent les seules structures de 
données autorisées par les langages dans lesquels ils sont 
écrits : tableaux, pointeurs etc.. Ces structures sont mal 
adaptées au domaine qui nous intéresse, celui des machines 
informatiques complexes où les objets traités sont nombreux , 
peuvent être dynamiques et interagissent sans cesse entre 
eux.On voit heureusement de moins en moins de gros 
systèmes centralisés où tout est pris en charge par un seul 
programme. 

Par contre, l'étude de systèmes de diagnostic de panne ou de 
description d'activités de machines à mis en relief la 
structuration des données,des contrôles de cohérence et des 
actions locales sous une forme directement liée a 
l'architecture du système que l'on veut représenter. L'écriture 
de tels systèmes est plus aisée et permet surtout d'énoncer 
clairement et rapidement les petits mécanismes qui donnent 
"vie" au système , plutôt que d'avoir à passer du temps à 
simuler de tels mécanismes à cause de l'inadéquation du 
langage utilisé. 

En 87, on avait dégagé deux approches apparemment 
opposées : le diagnostic espion et le diagnostic intégré à la 
commande . Le diagnostic espion, c'est-a-dire rapporté à une 
machine et à un logiciel de commande déjà existant, 
débouche sur un premier projet : GENSIM, qui à partir d'une 
description architecturale de la machine mère et/ou d'une 


description de la structure du logiciel de commande, permet 
d'écrire de manière automatique des programmes, qui une fois 
compilés, délivrent par activation de mots de commande de 
la machine ou d'ordres de plus haut niveau, des traces écrites 
des flots de données employés et des opérateurs traversés. 


Mis à part le domaine direct d'application de GENSIM qui 
est celui des boîtes noires, ces programmes ne donnent une 
trace qu'à partir des sorties que l'on doit spécifier 
manuellement. Ils pêchent par l'imprécision et le manque de 
souplesse du mode de description d'architecture utilisé en 
entrée, et surtout par la même imprécision en sortie : la trace 
fournie nécessite après coup, de gros efforts de traduction et 
de reconstruction de l'automate fils, handicap d'autant plus 
paradoxal que cette description existe déjà dans GENSIM 
sous une autre forme. 

Nous retirons de l'expérience de GENSIM plusieurs 
enseignements : 

La technique de programmation utilisée dans GENSIM ( une 
fonction d'impression par opérateur de la machine mère, 
appel des ces fonctions tabulées sous une forme qui 
schématise l'architecture, sous le contrôle des mots de 
commande) sous-tend en fait un mécanisme très dégradé de 
programmation orientée objet, mais GENSIM était écrit hors 
de tels principes. 

Le point est important car le système de diagnostic est avant 
tout un programme et le choix du langage importe beaucoup 
du point de vue facilité d'écriture, déverminage ( certaines 
gymnastiques sur des structures fortement interconnectées 
répercutent des erreurs pratiquement impossibles à pister) et 
maintenabilité. (le sytème est appelé à évoluer) 

Nous verrons aussi que ce choix peut en fait totalement 
influencer le concept du diagnostic. 

GATTRI: 

La première définition de GATTRI, commencée en milieu 
d'année 87, s'est résolument adaptée par la suite au concept de 
programmation orientée objet et ce, dans ce sens et non 
l'inverse. 

Rappelons d'abord que l'expérience GATTRI fut entreprise 
dans un triple but : 


1 Réaliser le système de commande du nouveau module 
Région (COLISE), dont la nature très fortement MIMD rend 
très difficile une programmation classique : pas d'assembleur 
, pas de structure figée ( machine "molle"} et ressources 
limitées et difficiles à gérer en absence de prévision et de 
contrôle d'accès à ces ressources. 


2 Profiter de l'écriture de cette commande pour valider les 
premières méthodologies dans le domaine de l'interface à 
l'utilisateur (cf Thèse $. DACIC) et le diagnostic intégré à la 
commande, puisque cette deuxième méthode est rendue 
possible par l'écriture en cours d'un logiciel de commande. 


3 Evaluer les possibilités apportées par la programmation 
orientée objet. 

En effet, le concept, bien qu'assez naturel est d'un 
apprentissage difficile pour certaines formes de ces langages 
(cf C++ et sa syntaxe) et d'un maniement parfois redoutable 
(le coté résolument localisé et anti-procédural est parfois très 
déroutant) 

Nous insistons sur le fait que ce sont les concepts de 
diagnostic espion et intégrés à la commande qui se sont 
adaptés à la méthodologie Objet et non l'inverse. La 
méthodologie objet n'est pas qu'une technique de 
programmation élégante, donnant des programmes facile à 
maintenir et extensibles (critères importants pour tout gros 
logiciel) , c'est la première approche résolument cellulaire de 
description de comportements locaux d'objets autonomes 


participant à un processus qu'on ne peut décrire simplement. 


Elle assure surtout un lien crucial entre la programmation 
classique Von Neumann et la programmation distribuée telle 
qu'on la trouve dans les langages d'acteurs (CHORUS) ou 
autres langages distribués (OCCAM...). Elle permet de tester 
des modèles MIMD sur des machines Von Neumann en 
simulant un comportement parallèle des objets, en attendant 
les modèles de programmation purement MIMD sur des 
machines MIMD. (L'expérience GATTRI pilotant COLISE 
est dont tout à fait intéressante sur ce point) 

. Nous décrirons comment l'approche GATTRI à fait évoluer 
l'idée de diagnostic et comment elle a unifié les concepts 
espion et intégrés. 
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GATTRI (en cours de réalisation ) nous a permis 
d'implémenter la première construction interactive de graphes 
d'objets interconnectés et de valider le concept retenu pour les 
deux formes de diagnostic, à savoir : 

C3.Sa Phase 1 

Une base de données architecturales représentant la machine 
mère virtuelle dans ses parties figées et semi-figées (c'est-a- 
dire où l'on peut déterminer un graphe support de tous les 
traitements exécutables sur ces parties.) est élaborée sous 
forme de graphes d'objets, qui peuvent être bouclés ou non. 
Ces graphes peuvent être construits manuellement ou 
automatiquement par lecture de netlists d'origine quelconque 
(on peut par exemple lire une netlist DAISY et créer les 
classes et les objets correspondants), ou encore par n'importe 
quel programme de commande d'un module dont on peut 
récupérer les requêtes aux ressources: une demande de 
ressource crée l'objet correspondant. GATTRI, par exemple 
est un exemple de programme qui élabore dynamiquement 
une architecture d'opérateurs de COLISE dont le graphe est 
naturellement raccordé au graphe de la machine mère puisque 
celle-ci intègre les liaisons entre la partie architecturale figée 
d'HECATE et le module COLISE. 

C3.5b Phase 2 

Les opérateurs du graphe virtuel ont la même caractéristique 
capitale que les opérateurs physiques ils sont 
programmables, c'est à dire que sous gouverne de mots de 
commandes, ils émulent une fonction particulière et ils 
privilégient certaines liaisons dans le graphe support. 

Au sens fonctionnel c'est bien un nouvel opérateur que l'on 
fait apparaître dans la machine à la place de son support : Un 
processeur devient un additionneur , un multiplexeur devient 
une liaison avec un certain retard. | 
C'est à partir de cette remarque que l'on définit le mécanisme 
de base de toutes les formes du diagnostic : Un objet du 
graphe support de la machine virtuelle, sur activation par 
mot de commande, instancie l'objet fonctionnel en lequel il 
se transforme et prend sa place dans le graphe. Plusieurs 
objets ainsi crées, s'interconnectent et constituent le noyau de 
la forme diagnostiquée. Nous appellerons ce processus : 
émergence de la forme diagnostiquée. 

Ce processus reproduit parfaitement les modifications de la 
machine au cours du temps (en temps différé si nécessaire) et 
donne une image des modifications apportées aux algorithmes 
implémentés. On détecte ainsi les bouclages ( suite de sous- 
graphes identiques ayant en commun un opérateur dont un 
paramètre change constamment.) et on dispose ainsi d'un outil 
capable de détecter des structures de contrôle bouclé, non 
modélisées à priori au lancement du système. 

Plusieurs remarques sont à faire : Le processus est 
parfaitement contrôlable et surtout paramétrable : choisir un 
type d'architecture plutôt qu'un autre pour l'automate fils, 
c'est instancier des formes particulières d'opérateurs réduits 
choisis dans une bibliothèque particulière. La forme 
diagnostiquée est alors directement exploitable dans le type 
d'architecture choisie. | 

Cette propriété peut être attachée dynamiquement dans des 
facettes des objets (particularisation de la structure suivant 
l'endroit) ou peut être exploitée plus tard. | 
L'émergence de plusieurs sous-graphes (le parallélisme total 
est conservé par le processus ) assure automatiquement la 
cohérence de ceux-ci: des réflexes sur les connexions 
détectent les erreurs de types ou de sens ou de 
programmation, les sous-graphes non totalement connectés 
ne débouchant sur rien ou sans entrées, détectent une erreur 
de programmation et une reprogrammation, la détection de 
conflits. 

De plus comme on peut engendrer à tout moment la forme 
fonctionnelle de n'importe quel sous-graphe, on est à même 
de vérifier l'exactitude de cette forme qui est, rappelons-le, 
la forme réellement implantée en machine. On se donne ainsi 
un système de vérification de cohérence locale et globale sur 
un logiciel de commande d'une machine ou un tel système est 
difficilement envisageable. (machine répartie à commande 
répartie et parfois conflictuelle.) £ 

La programmation des opérateurs de la machine virtuelle 
utilise les réflexes au sens objet du terme : Les champs d'un 
mot de commande, rendus sensibles pour un opérateur 
déclenchent celui-ci sur simple réception d'un ordre global , 
pour une carte par exemple. 

Nous pouvons de plus imposer aux sous-graphes extraits, un 
processus de "réduction" qui est lui aussi localisé dans les 


objets qui doivent disparaître, en temps que résidus de la 
structure de la machine mère : Les multiplexeurs instancient 
des boites retard, qui peuvent s'auto-éliminer dans les sous- 
graphes diagnostiqués. 

Enfin nous concluerons en précisant que la conversion en 
sortie des sous-graphes en descriptions architecturales plus 
proches des produits de la CAO déjà existants, est très facile 
à obtenir vue la localisation extrême des données afférentes 
aux différents opérateurs et des informations relatives aux 
liaisons entre ceux-ci. 


À friendly interface for complex machine programming 
S. Dacic, T. Bommart, B. Zavidovique 
COMPINT 87 - Montréal - 9-13 Novembre 1987 


C3.6 Acteur de contrôle de la carte "COURBE". 
Ch.ROSNOBLET (D.IRLANDE) 
La carte COURBE est contrôlée par un acteur CHORUS qui 
est la transposition, du logiciel de contrôle écrit en langage C 
par M.P. Gayard. La tâche de cet acteur est de faciliter la 
mise au point de la carte en permettant l'accès à ses registres 
de façon simple. 
Pour l'instant l'acteur de contrôle de la carte et très 
rudimentaire, car il ne supporte que la programmation de 
celle-ci pour la mise au point du matériel. Les notions de 
transfert des résultats vers les autres modules de HECATE ne 
sont pas traités, l'architecture matérielle de la carte n'étant pas 
totalement fonctionnelle. Mais ceci devrait apparaître 
prochainement. 
L'acteur est constitué d'un analyseur syntaxique, qui 
déclenche les appels aux fonctions.La syntaxe d'une 
commande est du type: 

fonction [arg1 …[argn]] 


Saisie d'une commande 
Analyse syntaxique (découpage) 


non Chaine 
OK? 
oui 


xecution de la fonction 


analyseur syntaxique 


Les principales fonctions disponibles sont : 

- écriture et lecture des différentes mémoires. 

- configuration de la carte (paramètres globaux, mode de 
fonctionnement, source à visualiser...) 

- transfert des données entre les différentes mémoires. 

- Sauvegarde et chargement des mémoires sur disque. 

- exécution des traitements effectués par l'architecture 
matérielle (histogrammes, projections, recherche de minima 
et maxima, tri des courbes.) 


Les principales difficultés rencontrées lors de la 
transposition de ce logiciel sous le système CHORUS sont de 
deux types: : 

- Pouvoir, sous CHORUS, accéder directement à la mémoire 
physique de la machine. 

- Résoudre les problèmes de passage de paramètres entre 

l'acteur écrit en Pascal et la bibliothèque C des procédures 

déjà existantes. 


C3.7 Simulation du multiprocesseur M.E.D.C.I.N. 
E. CHARPENTIER ((Thèse(ENS) P. MATHERAT 


}P. Clermont) 
C3.7a Introduction 
Il s'agit de réaliser une simulation fonctionnelle du processeur 
M.E.D.C.IN. Ceci d'une part afin de permettre la 
programmation d'applications réalistes, d'autre part afin de 
concevoir un modèle de programmation de la machine, c'est à 
dire de définir une machine virtuelle fournie au 
programmeur. Nous avons examiné plusieurs outils devant 
permettre la mise en œuvre de cette simulation dont, le 
“angage C++, la bibliothèque task, le système Chorus version 


 C3.7b C++ 


Ce sur ensemble du langage C a été créé par B. Stroustrup 
(Bell labs AT & T) dans l'intention de réaliser des simulations 
orientées événement. Les premières versions sont apparues en 
1980 sous le nom de "C with classes", puis en 1983 sous le 
nom définitif. [1 s'agit d'un langage à objets, fortement typé 
contrairement à C, il introduit le concept de classe concept 
clé de la programmation en C++ autant sous un aspect type 
abstrait de données que sous l'aspect programmation objet. 
C3.7c Task 


Cette bibliothèque écrite en C++ a pour but de réaliser une 
gestion du multi-tâches à l'intérieur d'un même processus 
Unix (une tâche est représentée par une instance d'une classe 
dérivée de la classe task). Ceci permet aux différentes tâches 
de partager un même espace adressable, donc de 
communiquer rapidement par échanges de pointeurs dans des 
files de messages, sans recopie de données. Il existe un 
facteur mille entre le nombre de processus maximal géré par 
une machine sous Unix et le nombre de tâches qu'il est 
possible de gérér de cette façon. La méthode de scheduling 
proposée est par contre non préemptive et inéquitable. 

C3.7d Chorus version 3 | 

Le système Chorus a été développé à l'I.N.R.I.A. de 1979 à 
1986. Il s'agit d'un système réparti qui permet d'exprimer et 
de réaliser le parallélisme et la communication par messages 
entre plusieurs acteurs. La version 3 (1987 Chorus systèmes) 
offre par ailleurs la possibilité de programmer plusieurs flots 
d'instructions parallèles à l'intérieur d'un même acteur. Ils 
communiquent également par messages, se partagent l'espace 
adressable de l'acteur et ses portes de communication. Du 
reste 1l est possible d'une part de programmer en C++ d'autre 
part de bénéficier d'un environnement usuel grâce à des 
acteurs Unix. 

C3.7e Conclusion 

Il paraît intéressant de réaliser la simulation de M.E.D.C.IN. 
sur station Sun puisque ce type de machine servira d'hôte aux 
premières versions du processeur. Le fait d'utiliser C++ 
devrait permettre un transfert aisé du code simulé sur l'hôte 
vers les processeurs élémentaires de M.E.D.C.I.N. pour 
lesquels un cross compilateur C existe déjà. Dans ce 
contexte, l'utilisation du système Chorus paraît plus probable 
que celle de la classe task sous Unix. Il propose des 
mécanismes de mise en œuvre du parallélisme plus complets, 
permettant de gérer un parallélisme réel, ainsi que des 
mécanismes de communication plus sophistiqués. 


C3.8 Activité Sphinx, 1987/88: 
P. CLERMONT ((Thèse (PARIS VIDM.NIVAT) 
B.Zavidovique) 
Les études des années précédentes ont conduit à la définition 
et à la réalisation d'un simulateur performant de la machine 
pyramidale Sphinx, qui a permis de simuler l'implantation 
d'algorithmes par nature bien adaptés à Sphinx [rapport 
1985/86], de plus des réflexions ont été menées sur 
l'architecture d'un système Sphinx et notamment des 
contrôleurs d'étage. 
Après cette première approche, dirigée par l'architecture, 
nous avons ressenti le besoin d'une approche dirigée par les 
applications: étant donné un problème réaliste de traitement 
d'images dont les méthodes de résolution sont connues sur 
ordinateur séquentiel, déterminer les principes d'implantation 
sur Sphinx, simuler l'éxécution, et estimer les performances 
attendues. 
Cette approche nous a conduits a aborder trois types de 
problèmes: 
- algorithmie spécialisée de traitement d'images pour Sphinx. 
- environnement de programmation nécessaire pour 
programmer de façon attractive sur ce type de machine. 
- les problèmes de système et de logiciel éxécutif. 
Notre approche a été essentiellement expérimentale, nous 
avons été amenés à proposer des mécanismes de 
programmation de Sphinx et à les estimer satisfaisants en 
pratique. Les problèmes précédents impliquent non seulement 
l'ensemble des processeurs pyramidaux (qui sont 
effectivement simulés), mais aussi les contrôleurs d'étage et 
les interfaces avec un ordinateur hôte [rapport 1985/86]. Nous 
n'avons pas cherché à simuler de façon précise ces derniers 
dispositifs matériels, mais les logiciels développés ont permis 
de préciser les fonctionnalités à en attendre pour supporter 
une chaïîne de développement efficace et attractive, résultats 
exploités dans le cadre de la conception de la première 
machine Sphinx (1989) [M88]. 


111. 


ti 15 ARR site 
a snmt .! 
CIILHI Lg 
L.J 
LILEE 


_ 
:] EH 4, 

‘EE LE LE ] 4 à 
N'HIIII 

L 

+ SET HI 

1 4 


‘a 3 





ifficile 


d 


une image 


(b) 
égions d' 
initiale 


dale en r 


ion pyrami 
( b ) Phase finale 


(a ) Phase 


Segmentat 








La programmation d'applications complexes a nécessité 
l'extension du simulateur dans l'optique ci-dessus: le logiciel a 
été transporté sur Sun4 10 Mips, dont il bénéficie 
particulièrement de l'architecture, et qui permet de simuler 
des algorithmes complexes sur des images multiniveaux 
256x256 avec des performances compatibles avec une 
utilisation interactive. A la couche logicielle primitive, 
simulant les instructions des processeurs élémentaires à 
opérandes 1 bit ("nano-instructions", pour utiliser le 
vocabulaire de la Connection Machine), nous avons rajouté 
deux couches logicielles: 

- des “micro-instructions", implantant des opérations 
(logiques, arithmétiques, comparaisons) entre opérandes de 
longueur variables interprétés comme des entiers signés ou 
non (à comparer à l'assembleur PARIS de la Connection 
Machine) [GG88]. | 

- une couche de gestion mémoire, permettant des 
allocations/désallocations dynamiques de variables 
pyramidales (ie, une variable par processeur, pour tous les 
processeurs d'une pyramide tronquée). 

Sur le plan algorithmique, nous avons étudié deux types de 
problèmes, qui nous ont semblé représentatifs, complexes à 
implanter par leur caractère non régulier, et rencontrés en 
pratique: 

- diverses variantes d'implantation de l'étiquetage de 
composantes connexes d'une image binaire. 

- un algorithme multi-critère de segmentation en régions, par 
grossissement de régions. 

Nous avons simulé effectivement certaines parties critiques de 
ces algorithmes sur des images réelles, qui nous permettent 
d'attendre de Sphinx des performances temps réel sur ce type 
de problèmes [R88]. 

Les techniques mises en oeuvre nous ont permis de définir, 
après formalisation, un embryon de ce que pourrait être une 
collection d'objets élémentaires de traitement d'images sur 
Sphinx, ainsi que les opérateurs associés [PC89]: 

- domaines d'objets de traitement d'images, et variables 
associées. Un domaine est une partition d'un plan de 
processeurs, codant un ensemble évolutif d'entités liées à 
l'image (contours, régions, points caractéristiques). Une 
variable associée code une variable liée à une entité de TI, et 
prend les mêmes valeurs pour tous les processeurs de cette 
entité. 

- graphes plans et pyramidaux. 

Un graphe, au sens considéré, est un sous-graphe du réseau 
d'interconnexion non orienté de la pyramide. Un processeur 
"pointe" donc un sous-ensemble de processeurs voisins 
directs. 

- représentation multirésolution abstraite des objets. A chaque 
objet de traitement d'images dans le plan de base est associé 
un ensemble de processeurs privilégiés dans la pyramide, qui 
le représentent, et sommets d'un graphe pyramidal. 

- fonctions de réduction, permettant la construction de 
graphes pyramidaux et de représentations en multirésolution. 

- mécanisme général de concentration/diffusion contrôlés par 
un graphe pyramidal, mettant en oeuvre des flots de données 
ascendants et descendants. 

Conclusion 

- Nous avons rencontré dans l'implantation des algorithmes 
les principaux problèmes apparaissant lors de la conception 
d'algorithmes distribués sur machine à mémoires locales: 

- la connaissance limitée d'un processeur sur son 
environnement. 

- les problèmes de maintien d'un état global cohérent d'un 
(sous-)système alors que les évolutions sont locales. 
Remarquons que, par son réseau pyramidal, Sphinx est très 
adaptée aux calculs de caractéristiques globales et à la 
diffusion. 

- Notre effort se poursuivra par l'étude de nouveaux 
problèmes d'une part (notamment, les problèmes de routage 
de messages), en essayant d'utiliser les concepts de 
programmation définis, d'autre part, par l'amélioration des 
résultats obtenus, notamment en segmentation, par 
l'utilisation d'heuristiques, au niveau de choix locaux, peu 
coûteux à implanter. Cet effort sera bien sûr intégré au 
premier prototype prévu de Sphinx (base 32x 32). 


P. Clermont. Traitement d'images sur Sphinx. 
Thèse de doctorat. (à paraître) 
J.C. Roussel. 


Implantation d'un algorithme de grossissement de régions sur 


Sphinx. ; 


Rapport de DEA Langages et Traducteurs, Université 
d'Orléans, 1988. 

B. Gillon, B. de Guyenro 

Implantation d'une bibliothèque de type assembleur sur 
Sphinx. 

Rapport de maîtrise C4, Université d'Orsay, 1988. 
Environnement de programmation et proposition 
d'architecture du prototype Sphinx. 

Rapport interne, Université Paris XI, Institut d'Electronique 
Fondamentale, 1988. 
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Real time synchronization in a multi SIMD... 
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C4. Algorithmie Traitement d'Images 


C4.1 Coopération modèle-primitives 
B.HOELTZENER-DOUARIN 

C4.la Présentation 

. Cette étude est relative à un essai de modélisation par analyse 
sémantique axée sur la connaissance a priori d'une application 
donnée. La démarche consiste dans un premier temps, à 
dégager les "mots-clé” de l'application puis à les organiser au 
moyen d'un réseau sémantique dont les noeuds représentent 
les objets (modèle ou parties de modèle) et les liens sont 
fonction des propriétés qui existent entre les objets. D'autre 
part, les noeuds sont eux-mêmes porteurs de connaissance 
(propriétés objet). Lorsqu'un objet n'est plus décomposable en 
de nouvelles entités alors ses propriétés tendent vers des 
spécificités d'ordre visuel qui tiennent compte du contraste et 
(ou) de la forme et (ou) de la dimension de cette entité 
observée dans l'image. 

Dès lors, la correspondance avec l'environnement de 
programmation (base d'opérateurs) dédié au T.I. (cf. C4.2) 
devient possible. En effet, les noeuds terminaux du réseau 
peuvent être traduits dans l'environnement par les 
"mécanismes" qui vérifient les mêmes propriétés que celles 
présentes sur les noeuds terminaux. Ainsi, la génération 
guidée par le réseau fournit de nouveaux “mécanismes” qui 
pourront être à leur tour intégrés. L'exemple suivant illustre 
cette méthodologie. Il concerne la détection de cibles en 
formation en imagerie infrarouge aérienne, étude qui a été 
effectuée dans le cadre d'un projet OTAN (RSG9). 

Dans la présentation qui fait suite, une première partie traite 
de la mise en correspondance des objets de la “sémantique 
application" avec les objets “abstraits" relatifs au traitement 
d'images (opérateurs ou "mécanismes" déjà implantés dans 
l'environnement et dont les propriétés génériques sont 
décrites). La seconde partie explicite les opérateurs instanciés 
et présente un schéma illustrant le mécanisme lié au modèle 
de la formation. 


C4.la Mise en correspondance Objets réels et Objets TI. 

Le formalisme utilisé permet d'exprimer la connaissance ou 
bien de l'acquérir via l'idée suivante: 

Descriptif d'un concept: décrire l'idée que “je m'en fais" et y 
ajouter l'idée “que les autres s'en font" pour qu'il soit l'idée 
que “l'on s'en fait”. 


Le formalisme est alors ainsi défini: 

objet : modèle 

entités: composantes du modèle 

type: sous-classes du modèle définies à partir des propriétés 
du modèle 

propriété objet: propriétés globales autres que celles reçues 
des propriétés inter-entités. 

propriétés inter-entités: propriétés locales qui validées sur 
l'ensemble des entités conduit à définir une propriété globale. 


1) Description sémantique liée au modèle de "formation" 
Le modèle de "Formation" à mettre en oeuvre est déduit de 
"la détection de cibles mobiles en formation en imagerie 
infrarouge aérienne", application prévue dans le cadre d'un 
projet OTAN. : 
Ce type d'étude fait intervenir les classes de traitements 
suivants: 

detection 

reconnaissance et interprétation 

poursuite 


Ces traitements s'appliquent sur les objets énoncés dans le 
"titre" de l'étude soient "cible" et "formation", ainsi que sur 
d'autres objets non inclus dans le modèle recherché (ï.e. 
formation) mais qui appartiennent à celui plus général de la 
scène. Citons à ce titre les routes, les reliefs, les arbres, les 
leurres.. qui interviendront lors de l'interprétation du 
scénario pour prédire puis vérifier certaines configurations de 
masquage. De ces éléments pertinents découle le réseau 
sémantique de l'application qui met en évidence les 
propriétés inhérentes à chacun des objets (noeuds) ainsi que 
les propriétés inter-objets (liens). Ce réseau peut ensuite être 
exprimé sous forme d'une représentation symbolique 
- facileinent exploitable. 

Les premières propriétés reçues par les objets résultent du 
type de capteur utilisé (infrarouge) ainsi que des conditions de 
prises de vue (aériennes, champ lointain). La description 


suivante donne un bref exemple sur la façon de représenter et 
d'organiser la connaissance: 

2) Description des modèles: 

objet : formation 

entités: cible, formation de type L (linéaire) 

type: formation H, W, L... (lié à l'inventaire fait sur les types 
de formation recensés propriété objet: apparaît, disparaît, 
occultée, totalement observée. 

propriétés inter-entités: ensemble organisé d'entités répondant 
à un certain nombre de critères d'ordre structurel + contraintes 
liées au type de modèle (nombre de primitives 
structurelles...) 


objet : formation L 

entités: cible 

type: nil 

propriété objet: primitive de la formation 

propriétés inter-entités: linéarité et équidistance + 
contraintes de l'application (nombre minimum de cibles à 
valider pour que la formation soit dite linéaire, distance 
maximale entre les cibles) 


objet : cible 

entités: nil (non perceptible hérité de la propriété de prise de 
vue lointaine) | 

type: nil (non perceptible hérité de la propriété de prise de 
vue lointaine) 

propriété objet: chaude, petite, de forme rectangulaire, 
localisée et mobile 

propriétés inter-entités: nil 


3) Description des objets T.I intervenant dans le modèle 

Le formalisme utilisé est identique au précédent ce qui assure 
une mise en correspondance immédiate. Toutefois, la 
représentation de la connaissance diffère de la précédente par 
le fait que les noeuds sont représentatifs cette fois, des 
propriétés de l'objet et au niveau inférieur, des propriétés 
inter-entités, les liens sont décrits par les objets (ou concepts 
sémantiques). Cette inversion est cohérente dans la mesure où 
le réseau ainsi constitué est une description fonctionnelle d'un 
ensemble de traitements validant sur les liens, les mêmes 
concepts sémantiques. Les propriétés, qui étaient d'ordre 
seulement sémantique dans la précédente description, sont ici 
associées à des opérateurs. 

Les exemples ci-dessous, concernent la description d'objets 
“abstraits" du type région, segment, primitives structurelles, 
structure qui interviennent pour la modélisation, dans la 
mesure où leurs propriétés sont compatibles avec celles des 
objets de l'application: 


objet : région 

entités: pixel ou contour ou point ou … 

type: région à forte ou faible luminance de petite ou grande 
taille, … 

propriété objet: brillance (liée à la luminance), taille (liée à 
la surface, au périmètre...) forme (liée à l'aspect contour,.….), 
localisation (liée au centre de gravité, .…..), … | 
propriétés inter-entités: ensemble organisé construit sur la 
base d'un certain critère d'homogénéité. 

objet : segment 

entités: point ou région ou … 

type: colinéaire 

propriété objet: localisation (points extrêmités et 
intermédiaires et inclinaison), taille (longueur)... 

propriétés inter-entités: ensemble organisé construit sur la 
base d'un critère de linéarité et d'équidistance. 


objet : forme 


entités: primitives structurelles (jonction, intersection, 
hybride ..) 


type: carré, rectangulaire, circulaire, H, W, L,... ou cubique, 


sphérique, … 
propriété objet: dimension de la scène (2D ou 3D), 


localisation (liée au centre de gravité,.…..), taille (paramètres 


déterminés sur l'enveloppe convexe,...), propriété globale 
liée à l'analyse (structurelle) par rapport à un modèle... 
propriétés inter-entités: ensemble organisé d'entités 


répondant à un certain nombre de critères d'ordre structurel 
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Les entités du type structurel sont décrites suivant ce même 
mode. Les propriétés déduites de ces diverses descriptions 
sont ensuite mises en correspondance avec celles induites par 
les mécanismes de l'environnement dédié au Traitement 
d'Images. | 

4) Correspondance entre modèles et mécanismes de 
l'environnement de programmation (critères fonctionnels) 
objet : cible — réfère à région 

entités: nil —réfêre au point 

type: nil —nil 

propriété objet: chaude —réfère à la luminance, petite 
— réfère à la taille, rectangulaire — réfère à la forme , 
localisation localisation (centre de gravité) 


propriétés inter-entités: nil réfère à un ensemble 
organisé construit sur la base d'un certain critère 
d'homogénéité 


objet : formation L —réfère à segment 

entités: cible réfère à point 

type: nil —colinéaire 

propriété objet: primitive de la formation — localisation 
(points extrêmités et intermédiaires), taille (longueur) 
propriétés inter-entités: ensemble organisé construit sur la 


base d'un critère de linéarité et d'équidistance + contraintes 
de l'application 


objet : formation —>forme 

entités: segment et primitives de structure (jonction et 
intersection et hybride) 

type: À ou W 

propriété objet: propriété globale de l'analyse structurelle 
2D par rapport à un modèle 

propriétés inter-entités: ensemble organisé d'entités 
répondant à un certain nombre de critères d'ordre structurel 


C4.1b Descriptions des mécanismes intervenant dans la 


construction des modèles: 
1) Conception du mécanisme associé au modèle "cible" 
Le modèle cible est construit dans l'environnement de 
programmation, par l'association d'un certain nombre 
d'opérateurs répondant aux propriétés du modèle. 

DETECTION DE REGIONS DE PETITE TAILLE ET DE FORTE LUMINANCE 
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2) Conception du mécanisme associé au modèle "formation 
ve 


Le modèle de la formation L est construit comme suit, une 


fois la localisation des régions effectuée (transformation des 
régions en points): | 


TRANSFORMATION 


REGION -> POINT 





CONTRAINTES DE L'APPLICATION 


3) Conception du mécanisme associé au modèle "formation". 
Cet opérateur d'extraction du modèle permet à partir d'une 
image de type point, d'organiser la connaissance sous forme 
d'une structure de données (image) qui valide les propriétés 
"segment" et "primitives structurelles" et d'une autre "tampon" 
directement manipulable. 

opérateur d'extraction d'un segment 

opérateur de recherche de primitives structurelles 
autour d'un segment 

L'opérateur traite la structure "tampon" du type segment et 
celle de type point et renvoie une structure de données (image 
étiquetée) du type "forme". 

---> Existence d'au moins un point à proximité du segment 
(seuil: contrainte de proximité liée à l'application [distance 
maximale entre deux points]) 

---> Existence d'un segment incluant ce point (étiquetage du 
segment) j : 

---> recherche du type de la propriété de la primitive 
structurelle (étiquetage de la "primitive" avec prise en 
compte ou non des contraintes liées aux modèles H et W 
suivant que les modèles sont ou non décrits) 

Cet opérateur détermine les liens structurels qui existent entre 
segments proches, il est possible à ce niveau, de faire 
intervenir les contraintes liées aux modèles des formations de 
type H ou W, l'opérateur est alors guidé et affiné sur le type 
de la structure (modèle). 






propriété formation 







image MODELE 
| Îée ope pois 
image a 
type formation (H,W) 


Contraintes 










+ Segment: nombre minimal de points 
distance maximale entre points 






+ Formation: nombre de primitives structurelles 
nombre de segments 






1 : détection de région de petite taille à forte luminance 
2 : extraction de segments 


3 : détection de primitives stracturelles 


Mécanisme de détection des formations de type H et W: 
C4.1d Conclusion 


Cette méthodologie permet une organisation hiérarchique de 
certains opérateurs de l'environnement dédié au traitement 
d'images. Elle définit un premier "mécanisme" dans notre 
associé à un modèle, dans notre exemple, par corrélation 
entre les objets de la sémantique et ceux de l'environnement. 
Ce dernier peut alors être étendu via la mise en 
correspondance à chacun des niveaux, d'opérateurs analogues 
(1e qui instancient les mêmes propriétés que ceux présentés 
précédemment). 


Detection of target formations in infrared image - 
Nato Progress Report RSG9 - Avril 88 
Nato French Draft Report RSG9 - Octobre 88 


C4.2 Description d'Algorithmes de T.I. 


V. SERFATY-DUTRON (Thèse (PARIS XI) 
B.ZAVIDOVIQUE) 
C4.2.a L'outil Traitement d'Images 
La conception de systèmes autonomes de vision est un thème 
de recherches ambitieux qui intéresse l'interprétation 
automatique de scènes. Dans un tel cadre, l'outil "Traitement 
d'Images" permet de mettre en œuvre des Fonctions qui vont 
s'échelonnant des méthodes d'acquisition du signal brut, à des 
procédés d'analyse complexes, bâtis sur des représentations 
élaborées des entités extraites de l'image. 
Devant la diversité des techniques abordées, les multiples 
aspects du Traitement d'Images ont induit de nombreux essais 
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de définitions, on les inclus dans le schéma classique, 
Traitement du Signal, Reconnaisance des Formes, ou 
conformément à l'approche "Vision", on les replace dans le 
cadre général du Traitement de l'Information, agrémenté des 
thèmes divers de la Classification. Ces points de vue révèlent 
le manque de spécificité attribué au Traitement d'Images 
s'inspirant de méthodes mieux formalisées par ailleurs. 

1)Le pôle Vision 

L'intérêt porté à la Perception a contribué cette dernière 
décennie à l'évolution du Traitement d'Images vers le pôle 
Vision qui recouvre l'ensemble des procédés produisant une 
reconnaissance et une interprétation de scènes visuelles 
complexes. 

La communauté Vision s'entend à identifier les modules 
descriptifs “de bas niveau” aux ressources du Traitement 
d'Images. Seule la phase d'interprétation induit des techniques 
"intelligentes" qui supposent la validité des primitives 
extraites satisfaisante: l'utilisation d'heuristiques doit remédier 
aux lacunes de descriptions des entités. 

Parallèlement, la communauté Image focalise son intérêt sur 
la Segmentation, en premier lieu, l'extraction de primitives 
(contours, régions, points d'intérêt) dont les propriétés 
incluent les notions classiques d'homogénéité, disparité, 
continuité, ou plus subtiles comme mouvement, distance, 
profondeur. puis sur la définition de structures symboliques. 
2) Les implications informatiques 

L'essor des techniques récentes de programmation contribue à 
améliorer les spécifications des structures primitives et de 
leur organisation. 

En préconisant les notions conjointes de structuration des 
données et de modularité des procédures, le Génie Logiciel 
permet de se dégager de la représentation des données et 
d'utiliser des structures mieux adaptées; la mise en œuvre de 
traitements complexes est alors plus aisée sans perte 
d'efficacité. 

Les apports de l'Intelligence Artificielle sont de deux ordres : 
facilités de représentation des entités "visuelles", définition de 
stratégies de résolution (heuristiques...). Ces traitements 
symboliques peuvent intervenir dès la Segmentation 
(coopération de primitives, appariements Modèles / 
Critères... ). 


C4.2.b Les motivations originelles de la recherche 
L'historique important des travaux, dont la littérature 
spécialisée est le miroir, représente un indéniable savoir-faire 
et constitue la seule source de connaisances disponible. 
Intrinsèquement dispersés et diversifiés, ces travaux 
recouvrent des techniques généralement adhoc. Cet ensemble 
d'expériences, représentant près de trente ans de création 
d'algorithmes, de traitement d'applications est difficile à 
appréhender par manque de méthodologie. Concrétisé par une 
production logicielle tout aussi importante, la nécessité d'une 
normalisation s'est inexorablement fait sentir. Encore 
d'actualité, la définition de "standards" limités à la diffusion 
de produits (données, logiciels) reste insuffisante et mal 
adaptée à toute tentative d'information mutuelle sur les 
spécifications fonctionnelles des procédures, a fortiori, leur 
compréhension. Bien que l'implantation soit ainsi simplifiée, 
leur utilisation efficace (techniquement) et satisfaisante 
(contextuellement) est loin d'être acquise. 
1) Les idées directrices | 
Une première attention doit porter sur l'organisation des 
logiciels, plus avancée que le classement par thèmes (reflet 
du schéma de résolution classique) néanmoins nécessaire 
pour utiliser ces logiciels dédiés. Un schéma non coopérant 
entre les différents niveaux de traitement, ne suffit pas pour 
développer des algorithmes originaux, ni pour s'inspirer des 
développements existants: la démarche naturelle consiste à 
essayer des variantes, dégager des rapprochements... en un 
mot, composer. 

Plusieurs stades doivent être franchis afin de parvenir 
efficacement à cette étape de Création et il convient de 
déterminer l'ensemble strict des outils et moyens nécessaires 
pour tendre vers ce but, à défaut de parvenir déjà à son 
aboutissement. 

H est primordial de s'affranchir des contraintes technologiques 
(en se dotant de moyens techniques efficaces) car elles 
deviennent incontournables à l'ultime étape d'exécution: 
l'implantation interviendra moins sensiblement, si l'on adhère 
aux principes de programmation par objet. 

La deuxième nécessité est de fournir les classes d'outils, qui 
vont s'échelonnant, des supports "systèmes" à l'interprétation, 
en passant par le “langage d'utilisation" des techniques 


- 


Traitement d'Images, pour la compréhension et l'acquisition 
d'un savoir(-faire). Nos contraintes, définition d'un minimum 
d'outils, de classes des entités manipulées, et des opérations 
associées, ont conduit encore ici à s'inspirer des approches 
fonctionnelles et Objets. 

Ces deux points, supposés résolus, suffiraient à des experts 
pour donner libre cours à leur imagination créatrice. Pour les 
autres utilisateurs, la tendance naturelle est de tenter de gérer 
au mieux et bien utiliser les connaissances expérimentales. 

Le savoir-faire acquis en Traitement d'Images est, à notre 
sens, principalement concentré sur la spécification précise des 
Opérateurs et de leurs caractéristiques fonctionnelles qui 
constituent leurs propriétés; ce sont eux, qui isolent et 
organisent des quanta d'informations, atome ou molécule de 
connaissance. 

2) La méthodologie proposée 
Notre hypothèse de départ a été inspirée par la constatation 
suivante : un algorithme se présente souvent sous la forme 
d'une combinaison d'Opérateurs dont l'enchaînement, non 
nécessairement séquentiel, peut être lui-même caractéristique 
des transferts de propriétés entre les Opérateurs. 

Dans l'espoir d'accroître sensiblement la diffusion de ces 
connaissances empiriques, une approche méthodologique a 
été définie; fondée sur la nécessaire définition d'une 
représentation adaptée, elle privilégie l'expression 
fonctionnelle des procédures (alliant des facilités techniques 
de programmation à des notions plus abstraites liées à la 
sémantique), favorise la description de traitements suivant un 
schéma commun, l'extraction des propriétés particulières, 
enfin permet la mise en œuvre de mécanismes générateurs de 
traitements. 

Notre ambition se limite à tenter d'exhiber les caractéristiques 
essentielles des Opérateurs, et ainsi, de se focaliser sur un 
autre point de vue Image. Afin d'avancer dans cette voie, 
deux principes généraux se sont dégagés: unification et 
analogie. 


Le premier, d'unification, privilégie la notion d'objet, des 
images aux opérateurs, jusqu'à parvenir à la définition d'un 
modèle des traitements. 

Conformément à cette volonté, les descriptions des "entités 
logicielles" successivement manipulées en Traitement 
d'Images suivent une progression hiérarchique croissante. 
Elles induisent en premier lieu des types ("images"), puis la 
spécification d'Objets, représentant les structures primitives 
liées à l'image. De même, les Opérateurs sont ensuite pris en 
compte et apparaissent sous la forme d'entités fonctionnelles 
encapsulées, ce qui favorise l'expression de leurs 
combinaisons. La notion d'Opérateurs intrinsèques, plus 
élémentaires, assure les nécessaires correspondances entre 
Objets de différents niveaux. En dernier lieu, une nouvelle 
structure, appelée Mécanisme, a été définie afin de disposer 
d'un modèle générique des procédures. Il code donc ces 
enchaînements au moyen de deux entités conceptuelles: les 
Opérateurs (définis récursivement) et les Liaisons. 


Le deuxième principe favorise les mécanismes d'analogie, mis 
en œuvre par Monsieur Tout le Monde afin d'avancer et de 
progresser rapidement .… et de comprendre après... L'objet 
Mécanisme qui supporte à la fois sa définition et ses propres 
transformations, permet d'implanter la définition des 
propriétés ainsi que leur transfert et de s(t)imuler des 
raisonnements d'analogie. Il assume ainsi le double rôle de 
structure de programmation et de représentation: révélant le 
schéma fonctionnel d'un traitement, on parle bien entendu 
d'Objet, dont la manipulation dynamique permet le codage 
d'algorithmes reconnus ou "inventés". 

A ce stade, les créations ainsi inspirées, restent à l'état de 
développements abstraits, ne peuvent être validées qu'après 
des successions d'étapes essais / vérifications; les techniques 
envisagées alors s'inspirent et prennent appui sur une autre 
facette de l'Intelligence Artificielle, l'organisation des 
systèmes à base de connaissances qui sont ici, des "exemples" 
de Traitements d'Images. ° 


Il est bien entendu, que même si on dispose d'une description 


plus sémantique et donc plus abstraite des opérateurs, cette 


"création" purement intellectuelle, traduisant une démarche 


fonctionnelle plutôt qu'applicative, ne serait que gratuite, si 
on ne parvenait pas à la traduire, c'est-à-dire à l'implanter afin 
de bien l'utiliser. L'intersection entre les deux fonctions, la 
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création et l'utilisation, ne peut trouver remède que dans 
l'intervention du Génie Logiciel. 
C4.2.c Définition de l'Objet Mécanisme 

1) Les entités constituantes 
La structure "Mécanisme" est une entité conceptuelle unique 
qui joue le rôle d'un Objet générique, modèle des procédures, 
sur lequel repose l'ensemble du système de description. Sa 
définition permet au concepteur d'algorithmes de "coder" des 
procédures simples ou complexes. Vu comme un mode 
particulier de représentation des connaissances, cet objet est 
conçu pour décrire et manipuler les propriétés des 
algorithmes. 
Ainsi, nous considérerons, comme principal axiome, que 
toute procédure de Traitement d'Images peut être décomposée 
en fonctions plus élémentaires dont l'association est 
spécifique. 
L'objet Mécanisme est défini comme un quadruplet 
(O,G;,L,R) où : O : ensemble des opérateurs, L : ensemble 
des liaisons caractérisant leur enchaînement, G : graphe 
support de l'association, R : relation d'équivalence sur O; il 
sera codé sous la forme d'un graphe valué de Frames. 
Toujours selon le principe d'une inspiration délibérément 
fonctionnelle, le bien-fondé de l'unicité de ce mode de 
représentation prend appui sur les notions de modularité, de 
généricité et d'encapsulation des entités abstraites et 
autonomes, plébiscitées par les approches de Programmation 
par Objet. Ainsi, tout Traitement d'Images décrit selon ce 
modèle, contient au sein de sa propre organisation, ses 
caractéristiques fonctionnelles (i.e son état local) et ses 
transformations éventuelles (i.e son comportement associé): 
de plus, la structure de graphe attachée permet de présumer 

des combinaisons de fonctions à y appliquer et de prendre en 
compte, à ce niveau, l'aspect mécanique de la programmation 
T.I. 
À partir des Objets définis dans le logiciel d'accueil, et des 
Opérateurs conçus par l'ensemble des utilisateurs de nouvelles 
entités conceptuelles, les englobant, sont isolées. Ces 
dernières devront supporter des manipulations de toute sorte, 
visant à accéder et éventuellement modifier leurs diverses 
composantes et propriétés. Dans les paragraphes suivants, 
nous allons décrire plus précisément chacune de ces entités : 
les Opérateurs, les Liaisons, les Graphes et leurs 
transformations assurées par la relation d'équivalence R. Les 
descriptions de O et L sont effectuées par l'intermédiaire d'un 
"langage commun" constitué par les attributs descriptifs. Les 
entités Opérateurs, Liaisons sont représentées selon un 
modèle unique. 
Ainsi, nous avons à notre disposition, un formalisme unique 
pour décrire les entités (Opérateurs, Liaisons) et un unique 
modèle pour la relation R afin d'effectuer des accès variés aux 
différentes propriétés. 

1-1- La notion d'Opérateurs 
L'ensemble O des Opérateurs spécifie les traitements 
impliqués dans la procédure que nous désirons isoler comme 
primitives {Oi). 

L 1 L2 


Û # 


_ Opérateur "atomique" s 


On peut distinguer deux catégories: les Opérateurs Atomiques 
et les Opérateurs Moléculaires; les premiers sont décrits par 
le biais des Fonctions et des Liaisons acceptées. ; les seconds 
sont des graphes d'associations, spécifiés au moyen des 
Opérateurs et des Liaisons intervenant dans leur composition. 
Ces deux entités se voient attribuer des caractéristiques 
fonctionnelles. 





Opérateur "moléculaire" 


Cette distinction intervient de façon transparente lors de la 
phase de description car tout Opérateur Oi peut être défini 
récursivement comme l'occurrence d'un Mécanisme (une 
association particulière d'opérateurs Ok: ({Ok},{Lk}, G)). 
Ainsi, un traitement complexe peut être vu comme une entité 
conceptuelle atomique Oi lors de la description d'un 
processus l'intégrant. 


Définition récursive d'un Opérateur. 


Les compétences en Traitement d'Images semblent 
concentrées sur les Opérateurs et ne sont réellement 
accessibles qu'au travers de leurs fonctions et possibilités 
présumées. Il est nécessaire de représenter ces propriétés 
diverses et variées en utilisant ne hiérarchie de concepts. 





Entité Opérateur 


1-2- La notion de Liaisons 

Les éléments de l'ensemble L, appelés Liaisons, sont les 
relations étiquetées qui associent les Opérateurs et 
déterminent ainsi leur interaction; elles sont spécifiées en 
fonction de contraintes émises sur les opérateurs 
potentiellement concernés. A ces liaisons sont attachées des 
propriétés spécifiques qui constituent leurs valeurs réelles. 
Actuellement, elles réfèrent à la fois aux flots de données 
(parallèle, séquentiel, tri, sélectionné, partiel...) et aux 
constructions de programmation (conditionnelle, récursive, 
itérative, ajout de paramètres, adressage spatial contraint.….). 
Certaines sont étiquetées comme effectuant des conversions 
de type de données. On peut déjà percevoir quelques 
propriétés sémantiques : notion d'antagonisme, réponse 
optimale à différents critères, style prédiction/vérification. 

L apparaît comme l'ensemble des valeurs possibles des arcs 
du graphe G. 

2) Le Graphe d'association 

G est le graphe d'association des éléments de O. Sa définition 
permet de décrire l'intervention fonctionnelle des Opérateurs. 
Ses noeuds acceptent des Opérateurs, éléments de O; ses arcs 
caractérisent leur organisation (association spécifique) via les 
définitions des éléments de L. Son utilité réside dans le fait 
qu'il révèle le schéma fonctionnel commun à plusieurs 
traitements, et par conséquence un aspect quelque peu 
systématique de leur conception. De par sa structure, propre à 
être manipulé puis éventuellement modifié, il devient aussi 
porteur de propriétés. L'idée est de l'utiliser pour une re- 
programmation et la simulation de nouveaux traitements par 
l'intermédiaire de la sélection de sous-graphes représentants 
de propriétés spécifiques. 

À partir d'une occurrence de mécanisme il est possible de 
sélectionner tout ou partie de graphe et de remplacer des Oi 
(originels) par des équivalents Ok et issus des résultats 
fournis par des définitions successives de la relation R 
spécifiques au critère d'équivalence choisi. 

3) La relation d'équivalence R 

R représente les types de manipulations qui peuvent être 
effectuées sur la structure Mécanisme. Elle permet de définir 
des accès sur une entité et d'établir ses transformations 
résultantes; les accès mettent l'accent sur des comparaisons, 
des extensions de traitement ou des généralisations; par 
exemple, il est possible de substituer certains éléments ou 
parties d'éléments de l'ensemble O par des éléments qualifiés 
de similaires. 
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Sa spécification permet d'améliorer la description d'une 
occurence de Mécanisme ou d'en générer une nouvelle. 
Ainsi, la définition d'une relation d'équivalence R permet de 
simuler des analogies par le transfert de propriétés; ces 
analogies peuvent être techniques ou correspondre à des 
notions plus sémantiques (détecteurs de contours, de régions, 
débruitage…). 

L'exploitation du mécanisme obtenu consiste en la définition 
de la relation d'équivalence R sur l'ensemble O qui est faite 
suivant différents niveaux relatifs à la description des 
opérateurs et des liaisons : les attributs fonctionnels, 
techniques, domaine d'application, généralisations… 

4) Mise en œuvre des solutions logicielles : Représentation et 
Implantation 

La mise en œuvre d'un environnement dédié au Traitement 
d'Images, doit assurer un support de développement et 
d'utilisation efficace. Afin d'établir un compromis entre cette 
nécessaire interaction et la spécificité des programmes de 
Traitement d'Images, deux approches complémentaires ont 
été mises en œuvre. 

La première approche a conduit à la définition d'un outil 
d'aide à la programmation; l'accent est mis sur l'organisation 
d'un ensemble d'opérateurs programmés, et la spécification 
d'un ensemble extensif de données typées; les 
développements algorithmiques sont facilement accessibles. 
Depuis 87, une nouvelle version de Lampion (Logiciel d'Aide 
à la Manipulation et à la Programmation d'Images et 
d'Opérateurs Numériques) a été réalisée : sa définition a repris 
les principes conceptuels précédents. Elle tire parti des 
facilités délivrées par le langage C, ce qui a permis 
d'implanter efficacement les objets et leurs transformations 
associées. Libérés de nombre d'entraves techniques, par 
l'emploi d'Unix", les efforts se sont portés sur les structures 
de programmation, tant pour les types que pour les 
procédures standards. 

À partir de ce stade, la deuxième approche repose sur l'intérêt 
d'une description fonctionnelle des données et des 
algorithmes, elle suppose la manipulation de concepts de 
Traitement d'Images, et la transmission de propriétés 
fonctionnelles lors du déroulement d'un algorithme. On 
évolue ainsi vers un outil d'aide à l'interprétation. A ce niveau 
d'abstraction, un algorithme est décrit comme un mécanisme 
d'association de différentes opérations sur des objets abstraits 
avec transmission des propriétés. 

Pour chaque entité de l'Objet Mécanisme, nous avons choisi 
le concept de Frames. Pour nos besoins propres, un langage 
Objet basé sur les extensions de structures du dialecte 
Le_Lisp a été conçu par B. Carré (héritage multiple, attributs 
multivalués...). L'utilisation stricte de ce langage Ovl ne 
permet pas la modification dynamique des classes génériques 
définies. À ces fins, B. Carré a défini un sur-langage d'Ovl, 
Fovl qui appartient à la catégorie des langages de 
représentation par Frames. Les entités de la structure 
Mécanisme sont maintenant définies suivant un modèle 
commun de méta-classe; les modes d'accès (via R) sont 
réalisés au moyen de filtres successifs de propriétés (chaque 
fonction de filtrage est conçue selon un modèle unique). 
C4.2.d Conclusion _: Les Mécanismes "Images" 

De nombreux travaux portent sur la définition de langages, et 
plus généralement, sur des environnements de Traitement 
d'Images, où des objets "image" sont définis, relatifs à la 
structure de l'image. Nous étendons la notion d'Objet aux 
algorithmes afin de parvenir à une description satisfaisante de 
leurs fonctionnalités. 

Dans ce domaine où l'expertise est prépondérante, il est 
nécessaire de concevoir un formalisme qui permette de 
décrire aisément les procédures classiques. Adopter une 
démarche fonctionnelle est un nouveau moyen d'étude et de 
conception d'algorithmes et, par la suite, un outil puissant de 
recherche et de génération de nouveaux algorithmes. Elle 
favorise une approche très progressive vers une aide réelle, 
structurée et méthodique en Traitement d'Image: elle permet 
dès lors d'obtenir une spécification unifiée des techniques et 
d'envisager ainsi l'acquisition progressive d'un savoir-faire. 
Un modèle descriptif d'algorithmes a donc été défini à partir 
de ces notions. Ses composantes réfèrent aux Objets 
(Images...), aux Opérateurs (Fonctions) et aux Associations 
d'Opérateurs (Algorithmes). D'un point de vue technique, 
l'utilisation des objets définis, autorise l'expression 
fonctionnelle des Opérateurs mis en œuvre, puis l'intervention 
de mécanismes plus complexes en simulant des notions 
d'analogie et de généralisation. 
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Afin d'isoler quelques facettes ou “points de vue" du 
Traitement d'images, des "Familles" d'algorithmes seront à 
cette occasion mises en évidence, révèlant ainsi les 
inspirations qui ont suscité leur définition, leurs éventuelles 
modifications et améliorations. 


C4.3 Segmentation de régions 
C. THOMAS ((Thèse (ENSPS) P.L WENDEL) 
B.Hoeltzener) 
C4.3a Introduction 
En segmentation d'images, l'étude d'algorithmes de type 
croissance de régions a été poursuivie sur la base de 
l'algorithme de Gambotto. L'effort algorithmique a porté sur 
deux points: 
- la décomposition modulaire des algorithmes. 
- la définition de critères en vue de la modélisation 
d'algorithmes. 
Cette approche a été initialisée à partir d'une application sur 
l'extraction d'objets métalliques (mines) en imagerie sous- 
marine de sonar latéral. Elle a permis d'établir un algorithme 
en introduisant des critères spécifiques à l'application dans un 
processus de croissance de régions. 
Décomposition 
Le principe de la croissance de régions consiste à partir d'une 
segmentation initiale de regrouper hiérarchiquement les 
régions connexes entre elles selon un critère d'homogénéité 
(valeurs des moyennes des régions proches, ou écart entre le 
maximum et le minimum des valeurs de luminance d'une 
région proche). L'algorithme considère initialement chaque 
pixel de l'image comme une région. 
Algorithme: : 
tolerance <-TO0; step <-STEPO; 
tant que nb regions > nb regions attendues faire 
tant que nb d'agregation n'est pas nul faire 

pour tous les pixels de l'image sur un 

voisinage 4-connexe faire 


si | Moy1 - Moy2 | < tolérance alors 
fusion(R1,R2); 
fin pour 
fin tant que 
tolérance <-tolerance + step 
calcul des moyennes des regions 
fin tant que 
Moyl1: moyenne de la région R1 associé au pixel 1 
Moy2: moyenne de la région R2 associé au pixel 2 
La décomposition de base est la suivante: 
- un étiquetage en composante connexe tolérant (deux pixels 
connexes ont la même étiquette si l'écart entre leur deux 
valeurs est inférieur à un seuil de tolérance) 
- calcul de l'image des attributs par région 


Sur cette décomposition, on peut alors “greffer" plusieurs 
contraintes sur les attributs des régions ainsi que des critères 
de contrôle du processus de fusion. 

C4.3b Algorithme d'extraction d'objets sur les images sonar 
L'algorithme procède en plusieurs étapes: 

- Segmentation par croissance de région en favorisant les 
regroupements dans le sens du vecteur écho-ombre et 
élimination des petites régions. 

- Seuillage 1 ( écho ) 

- Seuillage 2 (ombre) de l'image segmentée 

- Mise en correspondance écho-ombre 





Modèle de régions pour le détection 





Cet algorithme met en jeu des critères géométriques (taille et 
forme) et des critères sur les luminances des régions (sombres 
ou claires). Ces critères définissent un modèle de l'entité 
extraite par l'algorithme auquel correspond le modèle des 
objets effectifs de l'image. L'évaluation de l'algorithme 
permet de valider les critères en vue de remonter à un plus 
haut niveau vers une connaissance en segmentation et en 
traitement d'images. 

C4.3c Critères 

Plusieurs algorithmes de type croissance de régions ont été 
implantés. On peut définir deux sortes de critères: les critères 
locaux et les critères de contrôle. Les critères locaux sont en 
général des contraintes sur les attributs des régions tandis que 
les critères de contrôle décident de l'arrêt (ou de la poursuite 
de l'algorithme) et paramètrent les critères locaux. 

Les processus de croissance de régions sont très sensibles à 
des variations locales de l'image et ne sont en général pas 
stables dans la mesure où l'erreur de fusion peut se propager. 
Pour pallier cette difficulté, nous avons utilisé une structure 
de type quadtree et appliqué l'algorithme qui s'arrête lorsqu'il 
ne reste plus que N régions à chaque niveau de l'arbre (N 
dépend du niveau de l'arbre). L'arbre est parcouru de manière 
ascendante. L'utilisation de cette structure confère à un 
algorithme de croissance de régions une plus grande stabilité. 
Conclusion 

L'obtention de modèle en traitement d'images peut se faire par 
la définition des critères utilisés par les algorithmes. Les 
erreurs inhérentes aux algorithmes font que la mise en 
correspondance entre un modèle d'objet à extraire et les 
critères utilisés n'est pas toujours satisfaisante. On doit donc 
passer par une phase d'évaluation des algorithmes afin de 
valider, pour certaines techniques de segmentation, les 
critères les plus satisfaisants. 


C4.4 Algorithme de 
application à la poursuite 
P. BONNIN, C. MILLOUR (B. Zavidovique) 

Si nous appelons "caractéristique image", toute information 
extraite d'une image ou d'une séquence d'images, susceptible 
à elle seule de déclencher une action, dans une classe de 
scénarios élémentaires, alors le "mouvement" peut être 
considéré comme une caractéristique, au même titre que les 
caractéristiques statiques habituelles: régions, contours, 
points d'intérêt. 

De plus les caractéristiques sont fonctionnellement 
dépendantes, et ce de manière très étroite. Ceci signifie en 
particulier, que toute caractéristique peut être utilisée comme 
moyen d'en détecter une autre. Par exemple un contour, lié à 
la propriété de disparité de l'image, peut être (non 
trivialement) considéré comme la frontière d'une région, lié à 
la propriété d'homogénéité, et réciproquement une région 
comme l'intérieur d'un contour (fermé?). 

Le même parallélisme peut être établi entre les 
caractéristiques statiques et dynamiques de l'image. Une 
première classification "grossière" peut être envisagée selon 
que les propriétés statiques permettront de déduire par mise 
en correspondance entre images les propriétés dynamiques, 
ce que nous appellerons "traiter d'abord", ou que les 
propriétés dynamiques directement estimées sur une séquence 
permettront de retrouver des propriétés statiques, c'est-à-dire, 
de déduire dans chaque image la position de l'objet mobile, 
voire sa forme, ce que nous appellerons "traiter ensuite". À 
l'évidence, ces deux extrêmes encadrent de nombreux 
algorithmes où la distinction entre extraction de primitives et 
estimation est plus nuancée. 

L'étude comprend deux parties distinctes. 

La première est constituée d'un survol des algorithmes de 

détection et/ou d'estimation de la "caractéristique" 
mouvement, ceux-ci sont classifiés selon le critère 
précédemment évoqué. La seconde est dédiée à l'utilisation 
de cette caractéristique dans les systèmes de poursuite. 
Les propriétés dynamiques peuvent être obtenues directement 
soit en ayant recours à des espaces transposés, là où le 
problème est le plus simple à résoudre: Fourier, Hough soit 
en utilisant des méthodes "bas niveau" fondées sur la 
différence temporelle d'images (vision préattentive ou 
périphérique), ou sur la différence spatiotemporelle 
correspondant à l'exploitation de l'équation différentielle de 
contrainte du mouvement. Ces propriétés peuvent également 
être obtenues de manière indirecte, par segmentation statique 
puis par mise en correspondance entre caractéristiques 
extraites. 


détection de mouvement 





La seconde partie de l'étude est consacrée 

d'une part, à la présentation des buts et des problèmes 
rencontrés en poursuite: 

. la déformation de la "forme" inhérente à la variation du 
positionnement cible observateur ou à la forme elle même si 
non rigide; 

. Mmasquage partiel ou total de la forme au cours de la 
séquence 

. et d'autre part, à la présentation de quelques systèmes de 
pourquites existants: 

. corrélation 

. par programmation dynamique entre les lignes d'image 

. le système PRIAM 

. par mise en correspondance entre régions extraites 

. utilisant une segmentation coopérative mixte points/régions 


Méthodes de détection de mouvement. Application. à la 
poursuite - B.Zavidovique, P.Bonnin, C. Müillour - Ecole 
d'Automne Thomson (Oct. 88) et Greco TSI (Nov. 88) 


C4.5 Environnement de programmation lampion-C 

E. DEVYS, B. HOELTZENER, MV. SERFATY 

C.4.5a Présentation 

Dans le cadre de la réalisation d'un environnement de 
programmation dédié au traitement d'images, en 1986 (L. 
BOL.), une première version nommée LAMPION a été 
implantée sur Sel 32/87, écrite en Fortran 77. Ce système se 
présente sous la forme d'un outil conversationnel comprenant 
un langage de commandes interprété travaillant sur un 
ensemble d'opérateurs de traitement. Ces opérateurs œuvrent 
sur des paramètres dont les spécifications répondent à des 
structures de données appelées Objet de Traitement 
d'Images(OTT). 

Pour des besoins de portabilité, ce système a été traduit en C, 
langage mieux adapté à la manipulation des structures. On a 
reconsidéré notamment tout ce qui concerne la description des 
objets. En effet, un objet est décrit à l'aide d'une structure de 
base composée d'un en-tête donnant les caractéristiques de 
l'OTT (informations relatives au traitement et au stockage). Le 
système comprend alors l'ensemble des OTI ainsi que leurs 
fonctions de manipulation et de stockage. 


C4.5b Les Objets de Traitement d'Images 

Les objets de base de l'environnement de programmation sont 
les objets manipulés et mis en évidence par les algorithmes de 
Traitement d'Images (de la littérature classique ou originaux) 
développés par nos soins. Chacun des objets implanté est 
traduit à l'aide de structures "C" dont nous présentons 
brièvement les spécificités, puis les outils de manipulation: 

. En-tête de manipulation de l'objet avec définition de 
l'ensemble des genres autorisés pour l'objet (entier signé ou 
non, sur un byte ou 2, en valeur réelle ou logique) 

. Structure de données de l'objet à manipuler (définitions des 
paramètres et pointeurs). 

. Macros permettant l'accès direct aux différents paramètres 
de la structure et accessible par l'utilisateur 

. Macros d'accès mémoire permettant l'allocation dynamique 
ou statique; sont nécessaires aux fonctions de manipulation. 

. En-tête de stockage sur fichier correspondant à une structure 
de données répertoriant l'ensemble des paramètres de l'objet. 

Les objets implantés dans l'environnement de programmation 


sont: 

IMAGE PIXEL FENETRE 
VOISINAGE MASQUE HISTOGRAMME 
LOOKUP TABLE POINT CHAINE 

LISTE GRAPHE CONTOUR REGION... 


Chaque structure d'objet est définie dans un fichier séparé; 
par ailleurs, une structure "chapeau" appelée OTI permet de 
manipuler les objets indépendamment de leur type image 
(image, pixel,.…). C'est une structure contenant le type de 
l'objet et une union sur les pointeurs de tous les types d'objet. 


I] est à noter que les OTI peuvent être traités successivement 


par les opérateurs de Traitement d'Images; de ce fait, il est 
possible de les archiver sous forme de collections. Une 
collection est alors vue par le système comme un objet ou une 
séquence d'objets de même nature. | 

Les données relatives aux objets sont gérées à partir d'un 
ensemble d'outils permettant leurs manipulations soit à partir 
de fichiers au format OT, soit directement en mémoire. 
Descriptif du format de fichier OTI: . 

Les fichiers OTI sont composés par les trois blocs suivants: 
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- en-tête comprenant une partie générale aux fichiers OTT et 
une spécifique de l'objet. 

- plusieurs blocs de texte libre 

- données stockées en séquence 

Manipulation sur fichier OTT: 

- Ecriture d'un en-tête fichier 

- Lecture/Ecriture d'un élément dans le fichier (avec en plus 
pour la lecture, chargement de l'élément courant dans l'OTI 
courant) 

- Création d'un OTI conforme à l'en-tête fichier 

- Lecture/Ecriture de la documentation 

Manipulation en mémoire: 

- Création/Libération/Initialisation d'OTI 

- Copie des données de l'OTI 

- Utilitaires de balayage des données OTI 

Passerelles entre OTI: 

Cet outil permet le passage entre OTI (ou fichiers OTIT) de 
type image avec une conversion éventuelle du format (OTI -> 
OTT, fichier -> fichier et OTI -> fichier). 

C4.5c Conclusion 

L'environnement de programmation ainsi implanté, permet la 
conception guidée d'algorithmes en traitement d'images. La 
standardisation préconisée au niveau des entrées/sorties des 
opérateurs du Traitement d'Images (OPTI) permet d'utiliser 
plus aisément les divers algorithmes développés et conduit à 
la décomposition fonctionnelle (squelette C OPTTI) de chacun 
d'entre eux. L'environnement de programmation ainsi réalisé 
a permis d'intégrer un certains nombre d'opérateurs du type 
lissage avec préservation de contours, point d'intérêt, 
contour, région. 


C4.6 Système de Poursuite par Imagerie Infrarouge 
utilisant une Segmentation Coopérative Mixte Point 
Région 
P. BONNIN ((Thèse(PARIS VIT) E .PAUCHON) 
B.Zavidovique) 
Nous décrivons les " grandes lignes “ d'une étude entreprise 
en matière d'analyse de scènes dynamiques, et plus 
particulièrement dans le domaine de la poursuite par imagerie 
infrarouge. 
En prévision de développements futurs, allant dans le sens de 
la réalisation matérielle du système, nous avons essayé de 
tenir compte d'une manière "algorithmique" des contraintes 
imposées à un système réel: contraintes temporelles, 
d'encombrement, de robustesse et d'exactitude... Ceci s'est 
traduit par le souci de réduire la complexité de procédures 
existantes, de ne traiter que certaines parties de l'image 
(zones d'intérêt), de n'utiliser qu'un nombre restreint 
d'opérateurs (ce qui veut dire qu'un même opérateur peut être 
utilisé plusieurs fois lors de différentes étapes de l'algorithme, 
sur des données de nature différente), de développer une 
méthode de segmentation prenant en compte à la fois le type 
d'images traitées et l'application envisagée. Un autre avantage 
de notre algorithme, et non des moindres, est sa modularité: 
certaines parties pourront être réutilisées dans d'autres 
systèmes. Cette propriété est favorisée par l'environnement de 
programmation dans l'atelier d'Algorithmie. 
Le but du système est de détecter puis de suivre, au cours de 
la séquence, un objet, dans cette version préliminaire, ou 
plusieurs, dans des versions futures. La séquence äyant été 
acquise au moyen d'un imageur infrarouge à faible cadence 
d'acquisition, monté sur un engin mobile. Ces spécifications 
nous guident dans le choix de la méthode à utiliser, parmi les 
méthodes existantes dans la littérature. En effet la faible 
cadence nous interdit l'utilisation d'approches "continues" 
(basées sur l'équation du gradient spatio-temporel), et la 
mobilité, l'utilisation d'approches “bas niveau" de vision 
"préattentive" ou "périphérique". De plus, le souci de 
robustesse vis-à-vis de masquages partiels (but de cette 
première version), nous a amenés à considérer le schéma 
classique d'extraction de primitives puis de mise en 
correspondance. 
Ce souci de traiter plus particulièrement des situations 
critiques de scénarios opérationnels nous entraîne 
naturellement vers l'exploitation de la synthèse d'images, dans 
une première phase de développement et de mise au point des 
algorithmes. En effet, elle nous confère la maîtrise totale de 
la séquence d'image scénario (ie paramètres de 
positionnement en fonction du temps, des cibles, des 
éléments du relief, de l'observateur, ce qui permet la 
réalisation de masquages), qualité des images (ie résolutions 


spatiale et thermique, rapport signal à bruit). Ensuite, ces 
algorithmes sont testés sur des images réelles (collaboration 
avec des mdustriels, en vue du transfert des logiciels dans ce 
cas précis). 

La méthode de segmentation proposée tient compte à la fois 
du modèle physique du rayonnement infrarouge utilisé par 
l'imageur, et de l'application ultérieure. L'imageur fonctionne 
dans le domaine spectral de l'infrarouge lointain. Dans ce 
domaine, on observe l'émission des corps en fonction de leur 
température. On peut montrer simplement, en faisant 
l'hypothèse qu'en infrarouge les corps ont un comportement 
lambertien, et en se plaçant dans le cadre d'une observation 
en champ lointain, que l'image obtenue est une carte des 
températures de la scène 3D, en utilisant les lois de 
KIRCHOFF et de PLANK. Ceci nous montre que la “bonne” 
primitive à utiliser en imagerie infrarouge est la région car 
elle correspond à une entité physique de la scène: la 
projection d'une région 3D de la scène constituée de points à 
la même température. 

Mais l'utilisation classique de la primitive région est 
incompatible avec les objectifs généraux du système, d'une 
part les attributs relatifs à cette primitive (centre de gravité, 
surface, luminance moyenne, figure inscrite ou ex-inscrite) 
sont difficiles à gérer lors d'occlusions, notamment lorsqu'une 
région se trouve divisée en plusieurs, et d'autre part les 
algorithmes classiques de "croissance de régions" sont trop 
coûteux en temps de calcul. Néanmoins, dans le cadre de 
l'imagerie infrarouge, DL. Milgramm a montré qu'il était 
possible de procéder autrement pour extraire les régions 
projection des cibles de l'image: il propose la collaboration 
entre un détecteur de contours et un seuillage multi-niveaux. 
Si l'on s'intéresse à l'aspect poursuite, le système PRIAM 
nous montre qu'il est possible, dans le domaine visible, de 
poursuivre un objet mobile à l'aide de la primitive "point 
caractéristique”. De plus, l'information extraite à partir de 
cette primitive sera beaucoup plus simple à gérer en présence 
de masquages que l'information extraite des régions. Nous 
irons profit de cette propriété dans notre algorithme. 

La méthode de segmentation proposée comporte quatre 
étapes. La première consiste à sélectionner un petit nombre 
de points caractéristiques, régulièrement répartis autour des 
régions "chaudes" de l'image. L'algorithme utilisé est une 
version améliorée de l'algorithme proposé par M. Girard en 
1980 au cours d'un congrès OTAN. La seconde étape consiste 
à construire des régions à partir de chacun des points 
caractéristiques précédents. La croissance de région est 
initialisée (Voisinages concentriques de plus en plus larges), 
et guidée à partir du point (les paramètres permettant de 
décider si un pixel examiné fait partie ou non de la région 
autour du point sont calculés localement dans le voisinage 
3*3 caractéristique. La segmentation en régions n'affecte 
que les zones intéressantes de l'image, c'est-à-dire dans notre 
cas les zones claires. La troisième étape consiste à regrouper 
les régions adjacentes, supposées appartenir au même objet. 
Cette troisième étape est effectuée à l'aide de l'algorithme 
utilisé dans la seconde étape, mais à partir d'un nombre 
restreint de points caractéristiques, sur l'image binaire des 
régions obtenues lors de la seconde étape, au lieu de l'image 
originale. La quatrième étape consiste à regrouper entre eux 
les points caractéristiques appartenant au même ensemble de 
régions adjacentes. Nous appelerons par la suite "partie de 
l'objet" un tel ensemble de points, et la confiance accordée à 
un point appartenant à un tel ensemble sera plus importante 
que la confiance accordée à un point isolé. 

L'algorithme global comporte trois modules: le module de 
prétraitements ou de segmentation, dont nous venons de 
parler, le module d'apprentissage, qui permet l'acquisition 
automatique de la cible, suivie par le module de poursuite. 
Le module d'apprentissage permet la construction d'un modèle 
initial de la cible, à partir de la première image de la 
séquence. Pour ce faire, ce module regroupe les 
connaissances a priori sur les propriétés de la projection de la 
cible dans l'image, codée de manière déclarative. Il 
sélectionne la "partie d'objet" ressemblant le plus à un modèle 


idéal de cible c'est à dire de forme connexe, constituée de 


points de niveaux de gris différents c'est-à-dire provenant d'un 
objet 3D constitué de régions de températures différentes. 


Le module de poursuite effectue la mise en correspondance 


entre un modèle de points (rebâti entièrement après chaque 
image) et les points caractéristiques de l'image courante. Il 


utilise un algorithme de type “prédiction | vérification" . La 


prédiction consiste en la génération d'hypothèses à deux 
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niveaux d'association. Le premier consiste à associer le 
modèle à une "partie d'objet", le second à associer 
initialement un point de chaque ensemble de points précédent 
quel que soit le point. Afin de limiter le nombre d'hypothèses 
à générer, on impose aux points initialement associés d'avoir 
des voisinages semblables. La vérification consiste à calculer 
le coût de l'association. Celui-ci est la somme d'un coût local 
reflétant la ressemblance locale entre deux points associés, et 
un coût global traduisant la similarité géométrique des deux 
ensembles de points. On appelle la "partie d'objet" de coût 
minimal "région initiale optimale (RIO). Ensuite, connaissant 
l'hypothèse d'association de coût minimal, et la géométrie du 
modèle, on détermine un zone de confiance ZC, à l'intérieur 
de laquelle les points présents ont une forte probabilité 
d'appartenance à la cible. Cette zone est calculée et non 
prédite grâce à une estimation du mouvement à partir des 
images précédentes de la séquence. On recherche ensuite 
tous les points appartenant à cette zone. Ceci permet de 
former un modèle complet, constitué de tous les points 
caractéristiques visibles de la cible, donc de rester accrocher 
uniquement sur des parties du modèle. La mise à jour du 
modèle est effectuée à l'aide d'une nouvelle association, 
utilisant l'hypothèse optimale de la RIO. Elle consiste à 
pondérer tous les points de la ZC en fonction de la confiance 
qui leur est accordée. 

Les résultats nous montrent que l'algorithme de suivi 
fonctionne correctement, malgré les importantes déformations 
subies par le modèle, résultant des problèmes de masquage. 
Deux types de scénarios ont été testés: dans le premier, cas le 
plus réaliste, l'arbre derrière lequel passe la cible est plus 
froid, ce qui permet de réaliser un masquage partiel, dans le 
second, l'arbre a une température sensiblement voisine de 
certaines parties de la cible, ce qui pose des problèmes de 
déformation. L'algorithme donne des résultats similaires dans 
les deux cas. 

Concluons sur ses limitations. La première tient au fait qu'il 
est actuellement monocible, l'extension multi-cibles ne 
poserait pas de gros problèmes. La seconde, plus 
contraignante tient au fait que l'on s'est volontairement placé 
en phase terminale de poursuite, c'est à dire que l'on a utilisé 
des critères de forme, ce qui suppose une taille minimale pour 
la cible à poursuivre. Cet algorithme devrait prendre le relais 
d'algorithmes fonctionnant en phase initiale, et il faudrait 
alors gérer la commutation de modèle entre les deux phases et 
qui remplacerait le module actuel d'apprentissage. La 
troisième limitation tient au fait que l'on s'est, dans cette 
première version, limité au problèmes de masquages 
partiels, ie qu'à tout instant de la séquence, une partie de la 
cible doit rester visible. Pour remédier à cette contrainte, il 
suffirait par exemple de mémoriser le dernier modèle 
“cohérent” de la cible, et de l'associer au points des images 
ultérieures de la séquence. 


Analyse de mouvement par imagerie infrarouge utilisant une 
segmentation coopérative points d'intéret vs région 
P.Bonnin, E.Pauchon, B.Zavidovique - PIXIM Octobre 88. 


C4.7 Estimation de la déformation: application à la 
turbulence solaire 

B. COLLIN ((B. HOELTZENER) B. Zavidovique) | 
L'étude de la physique solaire par le traitement d'image 
poursuit deux objectifs: 

- la mise en correspondance des propriétés physiques et des 
propriétés des opérateurs de traitements d'images. 

- l'étude de la déformation par l'analyse texturelle. 

C4.7a Modèles de convection solaire 


Le soleil est une étoile dont l'étude remonte à l'antiquité. Les 
réactions nucléaires qui rayonnent de l'énergie se situent au 
cœur de l'étoile dans un noyau tournant probablement avec un 
vecteur rotation constant. Ce plasma engendre un champ 
magnétique dipolaire. Cependant on observe un renversement 
de ce dipôle tous les onze ans. 

1 convient en effet de prendre en considération la zone 
convective (située autour du cœur) qui tourne avec un vecteur 
rotation dépendant de la latitude. Cette zone semble jouer le 
rôle d'un amplificateur sélectif vis à vis du champ 
magnétique. Afin d'interpréter le renversement du dipôle les 
astrophysiciens ont proposé deux mécanismes de convection. 
À l'aide de photographies de la surface solaire appelées 
spectrohéliogrammes on peut en effet détecter le champ de 
| vitesse surfacique; pour ce faire, on suit le mouvement de 


deux types de structures facilement repérables, les filaments 


(accumulation de matière en suspension sur des lignes de 
Champ) et les facules (zone d'émergence de tubes de champ). 
La validité de l'un ou l'autre des modèles n'est pas assurée 
pour le moment car les études faites jusqu'à présent ne portent 
pas sur un nombre de données suffisant. 

C4.7b Mise en correspondance Physique -T.I. 

La recherche fondamentale ou appliquée en magnéto-hydro- 
dynamique solaire ne se préoccupe que rarement d'établir un 
réseau sémantique physique; ce réseau permet de cerner les 
différents objets manipulés ainsi que les liens et les propriétés 
qui leur sont rattachés. 

Exemple: réseau établi à partir de l'objet filament 
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L'information acquiert par là-même une structure 
hiérarchique. Ceci nous intéresse car le formalisme T.I. que 
nous utilisons met en avant les différents niveaux existants 
entre les objets couramment manipulés. 
On conçoit facilement que les outils de traitement d'images à 
manipuler ainsi que les opérateurs utilisés seront fortement 
influencés par le réseau sémantique. 
Par exemple l'extraction, ou du moins la mise en évidence 
des facules sur l'image par propagation de maxima locaux 
sera forcément vouée à l'échec! Il s'agit en effet d'attribuer à 
un pixel la valeur maximale de luminance observée sur un 
voisinage de celui-ci: 
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Exemple sur voisinage 8 connexe 
d'un point 


Remarquons que les facules sont des tubes de champs 
magnétiques qui, par leur émergence en surface, sont venus 
rompre l'homogénéité de la surface solaire. Ainsi l'aspect 
rugueux de la surface, la texture du fond solaire, est dû à 
l'émergence continuelle de petits tubes de champs. La 
propagation des maxima locaux va mettre en avant certes les 
facules mais aussi l'aspect texturel du fond et la détection n'en 
sera pas facilitée puisque ce que l'on pourrait appeler le 
rapport signal à bruit n'a pas diminué au cours de cette 
opération. Par contre les minima locaux (même principe mais 
basé sur le minimum local de luminance) donnent des 
résultats relativement sastisfaisants. 

Ce réseau sémantique nous permet aussi de ranger les critères 
de sélection des objets et de réduire considérablement les 
zones de traitements en affinant peu à peu les critères. 
L'importance de ce réseau est fondamentale en ce qui 
concerne les propriétés que l'appréciation visuelle des images 
ne permettrait pas de mettre à jour. 

C4.7c Détection des structures pertinentes 

1) Correction des images brutes 

Les images ont toutes été corrigées afin de présenter les 
mêmes caractéristiques globales: à 


Fer 


- axe des pôles contenu dans le plan de projection de la 
sphère solaire. 

- immobilité du centre solaire au cours de la séquence. 

Ceci permet d'assurer une phase de poursuite des structures 
pertinentes relativement simple puisque ce recalage 
s'apparente à une immobilisation du capteur. 

La correction des images nécessitant des calculs volumineux, 
les programmes ont été exécutés sur le calculateur SUN IV. 
Ceci nous a permis de tester la portabilité de l'environnement 
informatique OTT sur une machine SUN et d'établir bon 
nombre de squelettes de programmes qui faciliteront à 
l'avenir le développement sur SUN. 

2) Extraction de primitives 

Avant de pouvoir appréhender la déformation des structures, 
soit par analyse de la texture, soit par la mesure d'écarts à une 
loi donnée il faut dans un premier temps calculer les 
paramètres de vitesse qui régissent l'évolution moyenne du 
fluide surfacique. Les algorithmes sont développés pour 
mettre en œuvre les caractéristiques T.I. associées à la 
description physique de l'objet. Les critères de sélection de 
certaines zones de l'image sont affinés au fur et à mesure du 
parcours descendant du réseau sémantique. Les traitements 
actuels peuvent être schématisés de la façon suivante: 


image originale yennes 
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des critères plus forts 


Image Finale 


On remarque que les premiers critères sont relativement 
vagues: un filament est un objet qui apparaît sombre 
localement. Ceci vise à éliminer bon nombre de points sur 
lesquels les traitements coûteux représentatifs de critères plus 
fins ne seront pas appliqués. Cette démarche est aussi très 
intéressante dans le sens où elle permet une vérification de la 
validité du graphe sémantique; en effet, si le choix des 
critères de sélection est important (il est le refflet des lois 
physiques) l'ordre dans lequel cette sélection va s'effectuer est 
primordial. 
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L'aspect temporel intervient lors d'une phase dite de 
prédiction-vérification. La loi de rotation moyenne, connue 
de la physique, nous permet d'anticiper la présence de 
structures à certains endroits dans l'image n+1 connaissant 
l'image n. Cette prédiction-vérification permettra par la suite 
de réévaluer la loi de rotation et de détecter un des aspects de 
la déformation sur les structures de grande échelle. 


C4.7d Texture et déformation 


La disparité des traceurs du mouvement sur la surface solaire 
ne nous permet pas une mesure efficace du champ de vitesse. 
Le développement de l'analyse de texture comme vecteur de 
la détection de mouvement et plus particulièrement pour 
mettre en évidence les écarts à une loi moyenne de 
déplacement devrait assurer une densité nettement accrue du 
champ de vitesse. 


C4.8 Aide à la navigation de mobiles aériens à 
missions prédéterminées 
P.THEVENOUX ((Thèse (PARIS V) G.STAMON) 
B.Zavidovique) 
C4.8a Cadre 
L'étude concerne l'aide à la navigation d'un mobile aérien 
ayant une mission prédéterminée. Cela signifie qu'il doit 
survoler un parcours prévu comprenant certains sites 
remarquables. Les sites remarquables sont des constructions 
humaines d'une certaine importance comme les centrales, les 
ponts, les aéroports. L'information a priori est la 
connaissance d'une description volumique de manière plus ou 
moins grossière, des sites à survoler. … 
La scène est acquise par une caméra infrarouge, placée à bord 
du mobile et regardant au sol. Un apport d'information d'un 
autre capteur, par exemple millimétrique n'est pas exclu, mais 
les traitements sont a priori effectués dans la bande 
infrarouge. 
Le problème se décompose alors en l'obtention d'une 
description de la scène observée et d'une description adaptée 
du modèle tri-dimensionnel, puis d'une mise en 
correspondance des deux descriptions dans le but de tirer des 
paramètres suffisamment précis de localisation et d'orientation 
du site par rapport au mobile, permettant la poursuite correcte 
de la mission. 
Etant donné les variations considérables pouvant être 
obtenues sur des images infrarouge en fonction du temps, de 
la saison, de l'heure... une approche s'appuyant sur les 
nombreuses études de signature effectuées jusqu'à ce jour n'a 
pas été retenue.Un moyen d'envisager à terme une 
coopération avec d'autres types de capteurs et de tenir compte 
de ces impératifs a été de retenir une approche structurelle. 
C4.8b Description du site 
Les sites retenus a priori et qui fixent le point de départ de la 
démarche ci-après décrite, sont des sites non déformables. 
Leur principale caractéristique est l'importance du volume 
dans leur configuration afin de profiter au maximum de 
l'apport de connaissance que constitue le modèle. Cependant, 
un site ne sera pas considéré comme un ensemble 
monolithique entièrement volumique mais comme un 
assemblage dont une des parties au moins vérifie la propriété 
volumique. 
Dans ce cadre, on ne retient rien de plus que les sites 
construits par l'homme. En effet, les constructions humaines 
ont dans leur ensemble des propriétés structurelles assez 
fortes qui sont intrinsèquement très utiles, aussi bien pour la 
recherche d'indices visuels (extraction de primitives 
géométriques: droites, ellipses, bandes...) que pour la 
validation des hypothèses (symétries, parallélisme, …). 
En pratique, ces sites supposés indéformables sont tout de 
même soumis à des variations dues à des éléments extérieurs 
qui peuvent parfois modifier leur environnement interne 
(aéroport où les pistes sont occupées par des avions, 
feuillages...). C'est le processus de contrôle de la stratégie 
qui devra gérer ces écarts avec le modèle. 
Le seul support vraiment disponible pour la construction du 
modèle d'un site est l'imagerie satellite. Cependant, les 
problèmes de résolution restent encore trop importants pour 
une construction automatique du modèle. Il n'est donc pas 
réellement possible, comme cela est souvent fait avec des 
pièces industrielles même à trois dimensions (télémètre 
laser), de construire directement le modèle par des prises de 
vues. Aussi lé modèle ne peut se présenter directement 
comme les indices visuels extraits (problème de 


dimensionnalité). Les sources de construction de ce modèle 


sont soit des plans d'architecte, soit des vues aériennes 


diverses à partir desquels est manuellement construite 


l'information a priori sous un format du genre Conception 
Assistée par Ordinateur. | 
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(a) (b) 





Traitements d'images solaires 


( a ) Détection de filaments ( b ) Détection de facules 


(localement sombres et de variance élevée, (dem mais localement claires) 
double gradient directionnel élevé) | 


( c ) Aide à la décision automatique 
(propagation de minima locaux, niveau moyen par 
couronne (référence), estimateurs de confiance) 


La représentation choisie est polyédrique à facettes, qui a les 
avantages d'être d'un usage courant et qui peut donner lieu à 
des descriptions sommaires de certains sites. Elle est de plus 
bien adaptée au cas des images infrarouge (rayonnement) et 
relativement facilement manipulable dans le cadre d'une 
approche structurelle. Ce type de modèle permet en effet 
l'utilisation conjointe de sommets, d'arêtes et de faces, voire 
de blocs regroupant des assemblages particuliers de faces 
pour des modèles plus complexes. | 

L'étude concernant la description du modèle vise à une 
adaptation des modèles CSG (Constructive Solid Geometry) 
de synthèse permettant l'intégration d'information parfois 
redondante, mais en contrepartie, autorisant un accroissement 
de la rapidité de la mise en correspondance. Ainsi des entrées 
à la fois géométriques (primitives du modèle) et relationnelles 
(parallélisme, orthogonalité...) sont très favorables à cette 
manipulation. 


C4.8c Description de la scène contrainte au modèle 

Les images fournies étant de type infrarouge, la description 
de la scène est raisonnablement obtenue à partir des 
primitives contour dans un premier temps. Les images 
infrarouge présentent en effet une certaine homogénéité qui 
fait que la détection de ruptures dans le signal image est assez 
robuste. On notera cependant qu'une coopération avec 
d'autres indices visuels (régions, points caractéristiques.) 
est prévu à plus long terme afin d'utiliser pleinement 
l'information multi-primitives disponibles dans la description 
du site. 

Une première étape consiste donc en une segmentation de 
l'image pour obtenir un ensemble consistant et fiable de 
contours pouvant être appariés à la description du modèle. La 
chaîne de traitements actuellement implantée comprend un 
extracteur de gradient suivi d'un passage en coordonnées 
polaires, d'une extraction de maxima locaux directionnels. 


Exemple de prolongement directionnel 


Li pixels significatifs 


prolongements potentiels 





Les autres cas sont obtenus par symétrie de œæs deux motifs de base. 


Pour obtenir une représentation proche de la primitive arête, 
les contours obtenus sont ensuite affinés puis prolongés 
toujours dans l'optique du modèle arête et enfin chaînés avec 
les points de jonction comme points de coupure. A cette 
étape une relaxation est utilisée pour fusionner les chaînes 
tout en éliminant les barbules. Finalement une approximation 
polygonale termine ces traitements et l'on obtient un indice 
visuel que l'on peut espérer conforme à la primitive du 
modèle. 


Composantes du gradient Coordonnées polaires 
du gradient 
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C4.8d Extraction du site 


L'utilisation des images réelles est une source importante de 
complications (occlusions importantes) aussi bien pour 
l'analyse que pour la compréhension de la scène, au contraire 
de ‘milieux plus spécifiques (intérieurs, pièces 
industrielles…). Tout d'abord, la maîtrise de l'environnement 
n'est pas du tout assurée (vision tout-temps). Ensuite, le site à 
rechercher est totalement immergé dans la scène et il faut 
distinguer ses primitives de celles du reste du monde. 





Ce problème d'extraction de la zone d'intérêt est une source 
de complexité calculatoire. Il oblige à manipuler des données 
hors contexte et contribue à créer des hypothèses ayant peu de 
chances de succès. Cependant, une mise en correspondance 
peut s'effectuer sur l'ensemble des primitives de l'image mais 
diminuera sensiblement la confiance en la transformation 
déterminée. 

Une vision pré-attentive pourra être effectuée par le couplage 
au capteur infrarouge d'un radar à vision rasante. La détection 
d'objets en reliefs sur les images radar étant assez simple, 
une détection de zones d'intérêt dans l'image infrarouge peut 
être fournie. 

Les images radar ont la propriété d'être relativement bi- 
modales. Le fond global de la scène est régulièrement réparti 
sur les bas niveaux de gris et un pic apparaît sur des zones 
saturées. Après seuillage, on peut donc extraire ces zones 
saturées des images radar. Elles correspondent en principe à 
des fronts verticaux dans la scène ou à des objets métalliques 
(panneaux, rails...) 

Ün lissage (dilatation, croissance...) permet d'atténuer les 
effets brutaux du seuillage avant de fusionner les régions 
obtenues suivant un modèle géométrique correspondant à des 
pans verticaux de constructions. Un critère surfacique permet 
généralement d'éliminer le fausses alarmes. Une fois stabilisé 
le nombre de zones obtenues, la modélisation des deux 
capteurs détermine le changement de repère à effectuer pour 
obtenir leur localisation dans l'image infrarouge. 

De plus, une pré-comparaison de l'assemblage des reliefs 
détectés par le radar permet une première approximation avec 
des blocs de modèles complexes. 


C4.8e Mise en correspondance 

Les systèmes déjà existants de mise en correspondance ont 
trouvés plus d'écho dans le cadre d'un univers robotique et 
surtout planaire. La tendance est le passage à l'univers tri- 
dimensionnel et c'est dans ce cadre que s'inscrit l'étude en 
cours, en tenant compte des apports des dernières années sur 
les méthodes concernant les problèmes d'occlusion et de pré- 
compilation des modèles. 
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La mise en correspondance est assurée par la conversion du 
graphe 2D des primitives vers un graphe 3D grâce à des 
heuristiques simples. Une fois cette initialisation effectuée et 
des confiances établies sur les primitives disponibles, des 
structures regroupant les primitives sont établies sur des bases 
relationnelles. Un noyau de base est alors déterminé pour 
établir une hypothèse qui est mise en cause par le jeu de 
prédictions et vérifications successives sur les primitives entre 
la description du modèle et la réalité des données. La 
description validée permet alors l'obtention des valeurs de la 
transformation du repère du site au repère caméra et le 
recalage du mobile. 


C4.9 La synthèse d'images 
O.DEVILLERS 3 


La synthèse d'images , n'est pas une direction de recherche à 


SP, mais un outil destiné à valider des algorithmes de 


traitement d'images et de poursuite. L'essentiel des travaux 


antérieurs porte sur de la synthèse d'images infra-rouge en 
vision lointaine. Ces travaux ont débouché sur le logiciel 
existant traitant un cas de figure assez précis : un véhicule 
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(terrestre ou aérien) en mouvement observe un environnement 
composé 
* d'un fond numérisé (recadré par rapport à l'observateur), 
* de véhicules terrestres en mouvement, 
+ d'éléments de décor immobiles, 

° de fumigènes, 

° de leurres laser. 
Ce logiciel est spécialisé dans un certain type d'images. S'il 
est bien adapté à des besoins de type "vues infra-rouge depuis 
un véhicule aérien”, il n'est pas adapté à de nouveaux besoins 
du laboratoire en images de synthèse visible en vision proche, 
destiné par exemple à tester des algorithmes de stéréo pour la 
vision d'un robot mobile ou des algorithmes d'interprétation 
du flou de profondeur de champ. 

C4.9a Projet de logiciel de synthèse d'images 

La synthèse d'images comporte plusieurs étapes plus ou 
moins disjointes selon les algorithmes utilisés. On distinguera 
une phase de modélisation des objets et de leur mouvement, 
une phase géométrique de calcul des parties cachées et une 
phase de "rendu" c'est-à-dire de modélisation des échanges 
lumineux entre les différents objets de la scène. L'objectif est 
d'avoir à notre disposition un logiciel complet et efficace de 
synthèse d'images permettant d'une part la synthèse d'un 
scénario donné et d'autre part des applications en boucle 
fermée. 

Un tel projet est relativement important, il semble donc 
opportun de tirer profit de la convention de coopération avec 
l'équipe d'André Gagalowitcz à l'INRIA pour ne réaliser 
qu'une partie de ce logiciel. 

C4.9b Le projet "synthim" de l'INRIA 

Les travaux antérieurs portent essentiellement sur l'étude des 
textures. La technique suivante a été employée : 

* analyse de textures naturelles. 

+ détermination d'un modèle de textures utilisable pour 
l'analyse comme pour la synthèse. 

* synthèse de textures. 

* comparaison qualitative des images de départ et des images 
synthétisées pour la recherche des paramètres significatifs. 

* comparaison quantitative des images de départ et des 
images synthétisées pour affiner des modèles numériques de 
textures. 

Cette technique de "bouclage" s'est avérée très intéressante et 
a produit des résultats tant du point de vue synthèse que du 
point de vue analyse de textures. 

Le projet actuel est d'utiliser la même technique à une échelle 
de généralité supérieure en l'appliquant à la vision stéréo et à 
la synthèse d'images 3D. Il serait alors possible de faire 
progresser simultanément l'analyse et la synthèse d'images. 
L'INRIA dispose actuellement d'un modeleur développé en 
commun avec la SOGITEC. Ce modeleur permet de manière 
simple et agréable de définir des objets complexes à l'aide de 
primitives simples (lignes polygonales, arc de cercles, C- 
splines) et d'opérateurs classiques (translations, rotations, 
extrusions). À ce modeleur est associé un module d'animation 
qui permet de définir des scénarios. Les trajectoires des objets 
et de la caméra sont définies à l'aide des mêmes primitives 
que précédemment. Ce modeleur fournit une définition 
polygonale de la scène pour les différentes positions décrites 
par le module d'animation. C'est certainement un des 
meilleurs systèmes actuellement en service sur le maïché de 
la synthèse d'images. | 

L'étape de modélisation de la scène achevée, il faut 
maintenant utiliser un algorithme de parties cachées et de 
rendu pour calculer effectivement les images correspondant 
au scénario défini. 
C4.9c Algorithme envisagé | 
Îl faut pour choisir l'algorithme fixer les objectifs que l'on 
souhaite atteindre. La modélisation d'effets de réflexions 
spéculaires imposera l'utilisation d'un tracé de rayons, alors 
que l'obtention des ombres portées pourra être réalisée avec 
une méthode de "double buffer”. Etant donné que l'on désire 
des images de qualités différentes : images de profondeur, 
images visibles avec ou sans effets spéculaires, il semble 
opportun d'envisager un système présentant un maximum de 
modularité, qui comportera des algorithmes rapides et 
relativement frustes qui laisseront opérer des algorithmes plus 
élaborés comme le tracé de rayons là où ils sont 
indispensables. De plus cet algorithme pourrait être ensuite 
réutilisé pour appliquer des méthodes de radiosité. 
 C4.9d Objectifs 


Ce programme doit pouvoir réaliser des images de différents 
types : des images de profondeur, des images visibles 
présentant divers degré de réalisme, des images infra-rouge. 
De plus on modélisera des objectifs grand angle, et des effets 
de flou dus à la profondeur de champ. 


C4.9e Structure du logiciel 

Le logiciel réalisé comportera différent modules. L'algorithme 
de Warnock sera utilisé pour le calcul de "cartes" de 
projection perspectives à partir de l'œil ou des sources 
lumineuses. Ces cartes pourraient être utilisées directement 
pour la production rapide d'images "simples", ou comme 
premier résultat par un algorithme de tracé de rayons qui 
exploiterait ainsi au maximum la cohérence entre les rayons 
primaires et les rayons d'ombrages. Le tracé de Tayons sera 
optimisé à l'aide d'une méthode de subdivision spatiale. 
L'utilisation unique du tracé de rayons restera possible, par 
exemple pour la modélisation d'un objectif grand angle, ou 
d'un capteur satellite. 

C4.9f Conclusion 

La coopération avec l'INRIA permettra de doter le laboratoire 
d'un outil de description de scénario de synthèse d'images très 
performant. Sur cette base sera écrit un logiciel de synthèse 
d'images souple, c'est-à-dire permettant d'obtenir différents 
effets dans les images et permettant de moduler le coût de ces 
images en fonction des besoins. 


C4.10 Algorithmie rétinienne 

À. REICHART (Thèse (Paris XI) B. ZAVIDOVIQUE) 
C4.10a Introduction 

Depuis sept ans désormais le laboratoire cherche à définir un 
système de vision intégré. Qu'est-ce que la vision ? Le petit 
Robert donne cette définition : "perception du monde 
extérieur par les organes de la vue mécanisme physiologique 
par lequel les stimuli lumineux donnent naissance à des 
sensations”. C'est, dans le cadre du traitement par un robot, la 
réalisation d'un ensemble allant de l'acquisition d'une 
information visuelle à la prise de décision. Il est difficile 
d'envisager, pour une machine, des sensations. Nous voulons 
que la machine "voyante" puisse analyser à partir d'un capteur 
optique son environnement visuel. Ce but est en fait très 
complexe. Sa réalisation complète demande de faire 
intervenir non seulement des primitives de traitement 
d'images, mais aussi un système d'intelligence aretificielle 
pour comprendre le monde extérieur, c'est-à-dire relier des 
constatations visuelles (présence, position de forme, 
mouvement...) à un ensemble de connaissances acquises (une 
base de données). Ces connaissances seront accumulées par 
apprentissage où au contraire, elles seront imposées a priori 
de façon statique. | 
Quel système de vision recherchons-nous? Nous voulons 
donc une chaîne complète, c'est-à-dire allant du capteur 
décryptant les informations visuelles, à la prise de décision 
réagissant en fonction de l'apparition de ces informations. 
Cela implique une grande diversité des opérateurs, qui 
doivent utiliser des niveaux différents de représentation des 
données pour aboutir à l'information de haut niveau qu'est la 
prise de décision. Le volume et la nature des données seront 
très différents suivant le niveau de représentation. L'entrée 
optique correspond à un débit de données extrêmement 
important (mesurable en méga-octets par seconde). La prise 
de décision est au contraire plus rare et peut être réduite à un 
simple signal d'alarme (un bit), intervenant peu fréquemment. 
Mais ce système de vision doit aussi être intégré et 
embarquable. Il est donc impossible d'utiliser la réalisation 
d'un circuit spécifique pour aborder tel ou tel aspect de la 
vision. Il nous faut un ensemble d'opérateurs homogènes, 
utilisant le même substrat de silicium. D'autre part, nous ne 
pouvons faire appel à un environnement informatique lourd. 
Le système doit être autonome, et il aura donc des capacités 
de stockage d'information raisonnable. 

La vision de notre système est dite fruste. En fait, cela traduit 
non seulement une notion de simplicité, mais surtout de 
rapidité. La qualité du traitement sera sacrifiée en partie à sa 
rapidité. Quelles peuvent être les applications d'une telle 
vision? Par exemple, le robot doit réagir à l'apparition de 
caractéristiques inquiétantes. Reprenons les exemples très 
démonstratifs de B. Zavidovique. Des oisillons sont effrayés 
par la présence d'une ombre de forme triangulaire avançant 
vers eux dans une certaine orientation. Il est plus important 
pour eux de régir rapidement à une menace proche (ici, un 
prédateur comme une buse), plutôt que d'analyser finement la _ 
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menace, ce qui demanderait un temps de réponse prohibitif! 
La détection de mouvements brusques est un autre exemple. 
Quelque chose arrive sur vous, de façon brutale. Il est 
impératif de réagir vite (de baisser la tête par exemple), plutôt 
que de s'interroger longuement sur la nature de l'objet projeté 
SUr VOUS. 


C4.10.b Origine et nature de ce travail 

Cette thèse correspond à un développement logique dans la 
recherche. B. Zavidovique, lors de la conclusion de sa thèse 
en 1981 a prétendu qu'un dispositif complet de vision fruste 
peut être mené grâce à une famille unique d'opérateurs qu'il a 
définie et qu'il a appelée transformée combinatoire locale 
(tcl). Les avantages de cette famille d'opérateurs sont 
l'homogénéité, la mise en oeuvre efficace sur une machine 
cellulaire pour des traitements de taille réduite, et la 
paramétrisation par les données, dans le sens où, étant donné 
deux images I et J, il existe une opération t de cette famille 
telle que t (D) soit J. L'obstacle principal que B. Zavidovique 
voyait à la réalisation de ce projet était dans l'introduction de 
méthodes de décomposition, pour obtenir des traitements 
efficaces, puisque la décomposition permet justement une 
réduction de la taille des opérateurs. 

L'idée a été reprise par P. Garda, et elle a concouru là aussi à 
la rédaction d'une thèse (1984). P. Garda a réussi à introduire 
un mécanisme de décomposition et l'a appliqué à un exemple 
de reconnaissance de formes. Il manquait à cette thèse une 
expérimentation plus large, devant concourir à une plus 
grande souplesse de l'utilisation des mécanismes de 
décomposition conduisant à la reconnaissance de formes. 
Cela a été l'objet de mon travail ces trois dernières années. 

Le projet de rétine électronique se continue, avec d'autres 
travaux industriels et universitaires. Citons seulement les 
travaux de E. Belhaire (DEA 1988), et de T. Bernard (thèse 
en cours), sur les aspects intégration du circuit intégré, ainsi 
- que la thèse de doctorat de Patrick Garda (en cours), sur les 
aspects algorithmiques. 

C4.10c Déroulement 

Quelles sont les primitives de la vision fruste ? Les primitives 
étudiées ont été la reconnaissance de formes ou de 
caractéristiques géométriques dans une image, mais aussi la 
détection de mouvement et la poursuite d'objets en 
déplacement. Comme description plus précise donnons un 
résumé du découpage de la thèse qui a couronné cette étude. 
Le chapitre I est une présentation du sujet. Le projet "rétine" 
essaye de définir un dispositif autonome de vision, en 
utilisant un circuit monolithique intégrant les fonctions 
d'acquisition et de traitement. L'architecture choisie est celle 
d'un calculateur cellulaire à grain très fin, formant un réseau 
en quatre-connexité, et repose sur une famille unique 
j'opérateurs booléens locaux, appelés traitements 
combinatoires locaux (tel). Ce chapitre montre des techniques 
classiques de vision par ordinateur. La présentation permet de 
confronter des solutions classiques de la littérature aux 
solutions originales utilisées par la rétine. On aborde les 
différentes approches actuelles (vision, traitement 
d'images...) de la vision par ordinateur et plus 
paticulièrement l'algorithmie cellulaire. Ce chapitre fait le 
point sur les aspects algorithmiques promus d'une part, et les 
solutions architecturales retenues pour définir le circuit 
intégré monolithique et son environnement matériel d'autres 
part. | 


Les chapitres IT et III présentent des algorithmes applicables 
par une rétine tcl. Nous définissons dans un premier temps 
des outils de manipulation formelle de la famille d'opérateurs 
choisis. Les tcl sont représentés sous la forme de suites 
d'images binaires discrètes, et les traitements sur les tcl sont 
déduits de la bibliothèque des traitements sur images binaires. 
Ce mode de représentation présente une certaine efficacité de 
conception, et une grande rapidité de traitement. Le but de 
tels outils sera l'auto-programmation des algorithmes, 
puisque, grâce à la dualité entre images binaires et tcl, les 
calculs sur les tcl sont exécutés directement sur la rétine. Le 
chapitre IT traite des images binaires de type "silhouettes", 
comme celles obtenues après seuillage sur des images réelles 
numérisées, et qui sont des formes noires sur fond blanc. Il 
présente un mécanisme de décomposition, expliqué de façon 
très géométrique. Mais la décomposition ne permet que de 
définir une reconnaissance de formes sur des silhouettes. Les 
limites de cette approche incitent à la définition d'une famille 


plus complète de traitements sur images binaires de type 
silhouette, en utilisant l'acquis de la géométrie calculatoire 
(computational geometry), et un léger retour vers la 
morphologie mathématique. 


Au chapitre III, nous présentons des algorithmes de 
transcodage binaire (ou b-codage) pour appréhender des 
images de nature multiniveau. Cette nouvelle classe d'images 
a une nature différente des images silhouette. Une deuxième 
partie définit quelques aspects de l'interaction entre le b- 
codage et les traitements qui sont appliqués sur les images b- 
codées. Il est difficile d'appréhender les images b-codées par 
des simples itérations de décomposition. Une troisième partie 
imagine des passerelles pour revenir à des images de type 
silhouette, puisque ce problème a été traité avec succès. Ces 
passerelles sont appelées noircissage, et vont consister à 
noircir des zones de points majoritairement noirs, suivant la 
distribution des pixels. Mais le noircissage est une méthode 
de traitement indirecte. Une quatrième partie donne un 
algorithme de décomposition applicable directement sur des 
images b-codées. 


Le chapitre IV est centré sur les aspects informatiques de 
l'étude. Une première partie présente le langage utilisé pour 
simuler le circuit intégré. Dans une deuxième partie, on 
décrit sommairement la bibliothèque des traitements du 
simulateur et on termine par des petits exemples de 
programme. Enfin, la définition de l'interface entre le circuit 
et son environnement précise des contraintes sur la réalisation 
du contrôleur. 


Le chapitre V est consacré aux applications sur des images 
réelles de traitements rétiniens. L'application de 
“discrimination de formes géométriques" utiliser les 
primitives de reconnaissance de formes et de caractéristiques, 
ainsi que "l'application de la démarche tcl à la reconnaissance 
de caractères imprimés". Les deux autres exemples en 
"poursuite de cibles sur images infra-rouge" et "détection de 
mouvement" sont des études sur des séquences d'images. 
C4.10d Apport de ce travail 

Quels sont les points nouveaux développés dans cette thèse ? 
En géométrie calculatoire, elle présente de nouveaux 
algorithmes, qui s'exécutent dans une architecture 
massivement parallèle. Ces algorithmes utilisent des images 
binaires, et réalisent des fonctions de comptage, d'extraction 
d'enveloppes convexes.. C'est une nouvelle approche du 
traitement sur images binaires. De même, pour des images en 
niveau de gris qui sont transcodées, des caractéristiques 
(densité, agglomération de points) sont extraites là-aussi 
grâce à une exécution en parallèle. 

En reconnaissance des formes, de nouveaux algorithmes sont 
définis et expérimentés. Ils utilisent une décomposition en 
plusieurs opérateurs demandant des temps de traitements 
courts. Par l'introduction de tolérance au niveau de chacun 
des termes décomposés, le mécanisme de reconnaissance 
permet de détecter des motifs voisins du ou des motifs 
appris. 

Pour la réalisation d'un simulateur, un véritable langage 
programmation a été défini, incluant des types spécifiques au 
traitement d'images, et plus particulièrement à la famille 
d'opérateurs choisis pour la vision rétinienne. Cette étude a 
conduit à la construction d'une bibliothèque complète pour 
l'étude de ces opérateurs. 

Enfin, ce travail a fait large part à l'expérimentation mettant 
en oeuvre les primitives de reconnaissance des formes, et de 
nombreux résultats démonstratifs ont été obtenus. 


Des rétines pour voir!! 

À. Reichart, P. Garda, B. Zavidovique 

MARI, Paris (Mai 87). 

Algorithmie cellulaire pour une vision monolithique. 
À. Reichart, P. Garda, F. Devos, B. Zavidovique 
Neuro Image, Bordeaux (Octobre 88). 

À 60x60 processor array smart sensor. ù 


_P. Garda, A. Reichart, H. Rodriguez, B. Zavidovique, F. 


Devos. 


: LAPR Workshop on CV, Tokyo (Oct. 88). 


Yet another mesh array smart sensor for binary IP 

P. Garda, A. Reichart, H. Rodriguez, B. Zavidovique, F. 
Devos. | 

9th ICPR, Rome (Oct. 88). 
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C4.11 Evaluation des performances comparées de 
diverses méthodes de codage binaire d'une image 
analogique échantillonnée-utilisation de la théorie de 
l'incertitude. 

JCHAYOT 

C4.11a Principe : 

L'image à coder se présente sous la forme d'un tableau de 
valeurs analogiques, les pixels. Le résultat d'un codage 
binaire (ou B-codage) est un tableau de même dimension de 
valeurs binaires. Le principe d'évaluation repose sur une 
modélisation probabiliste de l'image à coder et sur l'utilisation 
des formules de la théorie de Shannon pour calculer 
l'nformation mutuelle entre cette image et l'image codée. La 
principale difficulté consiste à tenir compte de la très forte 
redondance contenue dans les images usuelles même non sur- 
échantillonnées. (L'image 1000x1000 d'une cible à détecter 
ne contient de fait qu'un Shannon d'information (d'incertitude 
à lever) si l'on sait a priori que cette cible a une chance sur 
deux de s'y trouver !!). La solution proposée ici est une 
évaluation paramétrique au niveau du facteur d'échelle : 

- l'effet des plus hautes fréquences spatiales est évalué grâce 
au modèle simple obtenu en considérant tous les pixels 
indépendants en probabilité; 

- l'effet des fréquences spatiales plus basses est évaluée sur le 
modèle obtenu en considérant indépendants en probabilité 
tous les “macropixels", chaque macropixel/image - 
regroupement de MXM pixels de l'image à coder- étant 
supposée l'expression d'une seule variable aléatoire. 
(redondance locale complète) 


C4.11b B-codes évalués 

Pour trois processus de codage binaire, les résultats peuvent 
être explicités au moyen de formules analytiques simples. 
Deux d'entre eux sont paramétrables car ils codent en réalité 
un voisinage (macropixel/code de taille M' adaptable en 
fonction des images afin de réaliser le meilleur compromis 
possible entre résolution spatiale et dynamique); ils sont 
déterministes. Le troisième est local (pixel binaire code un 
pixel analogique) et aléatoire. Au prix d'une ambiguité 
quantifiable et forfaitaire, il est supposé être autoadaptatif vis 
à vis du compromis susdécrit : 


. B-code "à plat" (BCP) : la moyenne de l'image analogique 
dans un macropixel-code est numérisé par un mot de M' **2 
bits rangé (mis à plat) dans un ordre quelconque dans ce 
macropixel. Ce codage qui s'avère optimal est pratiquement 
inutilisable car incompatible avec une visualisation ou des 
traitements combinatoires locaux ultérieurs. Il n'est retenu 
que comme référence. 


B-code à matrice de seuil (BCMS) : pour chaque 
macropixel-code, la valeur de chaque pixel binaire est le 
résultat de la comparaison de celle du pixel analogique et d'un 
seuil déterminé par sa place relative dans le micropixel. 


(Dans le cas particulier du macropixel/code réduit à un seul 
pixel, ces deux codes coïncident avec un simple seuillage). 


B-code "aléatoire" (BCA) : si "y" est la valeur relative d'un 
pixel analogique par rapport à la dynamique totale, les 
probabilités respectives d'obtenir les valeurs 1 et O pour le 
pixel binaire sont "y" et "1 - y"!. 

C4.11c Résultats 

On a supposé les lois de probabilité des pixels image 
uniformes (histogramme plat). 

Le résultat, information transmise par le codage ou mutuelle 
information, est fonction du type de codage éventuellement 
paramétré par la taille du macropixel/code et des fréquences 
spatiales image prises en compte par le biais de la taille du 
macropixel/image. Afin de faciliter les comparaisons, il a été 
normalisé par division par le nombre de pixel introduisant 
ainsi la notion d'information mutuelle unitaire (MU). 

Par rapport à la limite théorique de 1 Shannon/pixel 
effectivement réalisée par le B-code "à plat” adapté (la taille 
du macropixel/image égale à taille du macropixel/code), les 
pertes de performances sont le résultat, éventuellement 
cumulés, de la redondance interpixel du code, de 
l'hétérogénéité des probabilités des valeurs des pixels dans un 
macropixel/code, de l'ambiguïté introduite par l'aléa du 
codage. La principale motivation de l'étude était une 
comparaison entre les performances des codages 


déterministes et aléatoire : les premiers sont meilleurs pour 
les hautes fréquences, pour peu qu'ils soient adaptés, car ils 
sont extrêmement sensibles à toute désadaptation. Le dernier 
, Médiocre vis à vis des hautes fréquences, est par ailleurs 
totalement insensible aux redondances introduites par les 
basses fréquences manifestant ainsi une autoadaptativité 
parfaite. 
= CP: codage à plat 
e CMS : codage à matrice de seuil 
(# en densité) 
‘A CA : codage aléatoire 
indice : taille du méga pixel code 


IMU 


information mutuelle unitaire 


CP1 CP2 CP3 codage à plat "adapté" 
1 
CMS2 e 
0 CN ; 
; CMS oo Codage 3 
(désadaptation) Matniæ 
di d seuil adapté® CMS2 
| MS cms 
LI CA1 CAI B. codage aléatoire 
: CAI E CP2(désadaptation 
® CMS2 (désadaptation) 
1 2 3 4 M. 
taille du micropixel 
image 
C4.11d Conclusion 


Cette approche théorique absolue, qui a pour elle son 
caractère universel , c'est-à-dire indépendant du contenu 
sémantique des images, est à relativiser en fonction de 
l'utilisation ultérieure de l'image binarisée, et si le problème 
semble avoir reçu une solution élégante dans le cas de 
visualisation par le recours au B-codage neuronal qui prend 
en compte par définition l'effet intégrateur de l'oeil, celui de 
l'optimisation théorique d'un B-codage vis à vis d'un 
traitement ultérieur connu différent de l'intégration simple 
(reconnaissance, détection, poursuite) reste ouvert. 

C4.11e Autre utilisation de la technique d'optimisation de la 

ité e d'incertitude ‘obtentio 


d'une loi de probabilité la plus régulière possible sous 


contraintes. 

Cette technique, utilisée de manière implicite dans l'étude 
précédente (quand il n'y a pas de contrainte, la loi obtenue est 
la loi uniforme) s'avère commode pour des modélisations 
probabilistes avec connaissances a priori (fréquente en 
perception) exprimables sous forme de contraintes. La 
formulation est, par ailleurs, tout à fait usuelle en mécanique 
statistique (obtention de la formule de GIBBS par exemple). 
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Synthèse de séquence d'images fruste pour étalonnage d'algorithme 


- Doppler modifié 
- Scènes infrarouge élémentaires 





- 


D. RELATIONS EXTERIEURES 


DI Coopérations et interventions 


D1.1 Activités de formation 


Participations à l'enseignement de: 


l'ENSTA: TD, UNIX Systèmes | 
Enseignement par la recherche 
‘Cours de LISP, | 
| Cours d'I.A. 
Structure informatique de base 


l'ENS Cachan: 


l'ENST: 
l'IEF ORSAY: 


CNAM: 
SUPELEC: 

X: 
ENS/THOMSON: 


TP Electronique, TP électrotechnique 

TP en MCC 

TP automatisme, TP électro-numérique 

Cours langage traitement d'image 

Enseignement de 3ème cycle Traitement d'image et architecture 
Architectures de traitement d'image (CETAM) 

Architectures des machines 

Système informatique 

Architectures de traitement d'image (formation permanente) 


Traitement d'Image (formation continue) 


Séminaire sur le traitement d'images 


D1.2 Relations extérieures 


Les contacts et les collaborations avec d'autres organismes de recherche sont nombreux : 
- Institut d'ElectroniqueFondamentale d'Orsay (IEF) 


- Centre de recherche en Informatique de NANCY (CRIN) 
- Université de Haute-Savoie (LAMID micro-informatique 
- ENSET (LESIR) 


- Ecole des Hautes Etudes en Informatique - PARIS V 
- Université de Besançon 
- Ecole Nationale de Physique de Strasbourg 


- LAAS (Toulouse) 


- CNET Meylan 


- CNRS - participation au COST/TI/TS | | 
- CNRS - participation au groupe de travail architecture de TS et d'image du 


GRECO 


- Observatoire de Meudon 
- INRIA Roquencourt 
- Université de Berkeley, (Dept EECS) 


- Université de Yale, 


- Université de Stanford (AI lab) 


- MIT (AI Lab) 
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Représentation française aux groupes OTAN AC 243 commission : 
- RSG9 (traitement d'images) 


Représentation française aux groupes du GEÏIP 


- TA 10 
- TA 11 


Participation aux accords MWDDEA 
- 1244 (fumigènes et aérosols) 
- 1218 (camouflage) 
Contact avec AMX, SEFT, CPM 
Association avec CNRS/SPI, EDF, CEA, IFP pour la création du centre expérimental en 
hyperparallélisme 


D1.3 Relations industrielles 
Formation d'ingénieurs détachés au profit de l'AEROSPATIALE, de la SAT 


Amorce de coopération avec TRT, FRAMENTEC, ONERA 


Transferts vers et coopération avec SODIMA, EIA 
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D2. Publications et participations aux congrès 1987/1988 


Vers une application fondamentale de l'apprentissage : le contrôle de processus 

B. BURG, B. ZAVIDOVIQUE | 

2EME JOURNÉES FRANÇAISES DE L'APPRENTISSAGE - CHAMROUSSE - 12/13 
MARS 1987 


Des rétines pour voir 
À. REICHART, P. GARDA, B. ZAVIDOVIQUE 
MARI 87 - PARIS-LA VILLETTE - 18/22 MAI 1987 


Intégration et reconfiguration multisensorielle 
À. LANUSSE, X. MERLO, B. ZAVIDOVIQUE 
MARI 87 - PARIS-LA VILLETTE - 18/22 MAI 1987 


À comparative study: microprogrammed vs RISC architectures for symbolic processing 

J.C. HEUDIN, B. ZAVIDOVIQUE 

1987 TECHNICAL SYMPOSIUM SOUTHEST ON OPTICS, ELECTRO-OPTICS AND 
SENSORS 

ORLANDO), CA -17/22 MAI 1987 


Contrôle optimal d'un système de perception robotique 

X. MERLO, A. LANUSSE, B. ZAVIDOVIQUE 

IASTED INT'L SYMPOSIUM ON APPLIED CONTROL FILTERING AND SIGNAL 
PROCESSING 

GENEVE - 15/18 JUIN 1987 


Associative query at the microlevel using interconnection 

À. SAFIR, PH. KAJFASZ, F. DEVOS, B. ZAVIDOVIQUE | 

THE 2ND INTL CONFERENCE ON COMPUTERS AND APPLICATIONS -BEIJING 
(PEKIN) - 24/26 JUIN 1987 


MORPHEE: À multi access memory unit for on the fly image processing applications 
PH. KAJFASZ, B. ZAVIDOVIQUE - IBIDEM 


À compact symbolic processor for A.I. applications 
J.C. HEUDIN, C. MÉTIVIER, PH. KAJFASZ, B. ZAVIDOVIQUE, F. DEVOS - IBIDEM 


À Kalman-like filter based on joint discrete and linear- gaussian models 

X. MERLO 

ISSPA 1987 INT'L SYMPOSIUM ON SIGNAL PROCESSING AND ITS APPLICATIONS 
BRISBANE - AUSTRALIE - 24/28 AOÛT 1987 


Robot perception systems: some design issues 

B. ZAVIDOVIQUE, A. LANUSSE, P. GARDA 

INVITE NATO ADVANCED RESEARCH WORKSHOP ON REAL TIME OBJECT AND 
ENVIRONMENT MEASUREMENT & CLASSIFICATIONS - MARATEA - ITALIE - 31/08 
AU 3/09/1987 | 

A.K. JAIN EDITOR SPRINGER VERLAG 


À pyramidal algorithm to determine Curve orientation 
PH. CLERMONT, A. BELAID, A. MÉRIGOT 


4'TH INT'L CONF. ON IMAGE ANALYSIS AND PROCESSING - CEFALU, SICILE - 
23/25 SEPT. 1987 | | 


Real time synchronization in a multi-SIMD massively parallel machine 
PH. CLERMONT, A. MÉRIGOT 
CAPAMI 87 - SEATTLE, WA - 5/7 OCTOBRE 1987 
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Programmation de machines massivement parallèle, exemple de Sphinx et de la Connection 
machine . 

P. CLERMONT - CONF. INVITÉ GAMM NUMERICAL METHODS IN FLUIDS 
DYNAMICS 

INSTITUT MECANIQUE DES FLUIDES 

MARSEILLE - OCTOBRE 1988 


Functional Image Processing through Implementation of Regular Data-flow Graphs 

E. ALLART, B. ZAVIDOVIQUE 

20TH ANNUAL ASILOMAR CONF. ON SIGNALS, SYSTEMS AND COMPUTERS 
PACIFIC GROVE, C A - 2/4 NOVEMBRE 1987 


Fresh Connection 

À. SAFIR, PH. KAJFASZ, F. DEVOS, B. ZAVIDOVIQUE 

__ 20TH ANNUAL ASILOMAR CONF. ON SIGNALS, SYSTEMS AND COMPUTERS 
PACIFIC GROVE, CA - 2/4 NOVEMBRE 1987 


O.S.I.R.IS. - an Aided Shell to be incorporated to operating System 
J.M. FRECAUT, B. ZAVIDOVIQUE 
COMPINT 87 - MONTREAL - 9/13 NOVEMBRE 1987 


A friendly Interface for complex machine programming 
S. DACIC, TH. BOMMART, B. ZAVIDOVIQUE 
COMPINT 87 - MONTREAL - 9/13 NOVEMBRE 1987 


Les implications du temps réel dans l'architecture des machines symboliques. Exemple: 
commutation de tâches dans KIM 

J.C. HEUDIN, T. PORCHER, D. DEMIGNY, T. MAURIN, F. DEVOS, C. MÉTIVIER 
RFIA - 6EME CONGRES EXPOSITION RECONNAISSANCE DES FORMES ET 
INTELLIGENCE ARTIFICIELLE 

ANTIBES - 18/20 NOVEMBRE 1987 


Two normal form theorems for csp programs 
K.R. APT, L. BOUGÉ, PH. CLERMONT 
INFORMATION PROCESSING LETTERS - DÉCEMBRE 1987 


Intégration de mécanismes pré-attentifs et analyse pour vision de scènes dynamiques 
C. Millour, A. Lanusse 

2EME ATELIER SCIENTIFIQUE CNRS DU TRAITEMENT D'IMAGE 
AUSSOIS - 19-22 AVRIL 1988 


Applications Industrielles de l'Apprentissage Automatique 

B. BURG - INVITÉ À UNE TABLE RONDE AUX JOURNÉES nd disc DE 
L'APPRENTISSAGE 

JFA 88 - CASSIS - 5/6 MAI 1988 


Les architectures massivement parallèles - Les réseaux de neurones 

T. BERNARD - CONF. INVITE "J OURNÉE ARCHITECTURES NEURONALES" 
ORGANISÉE PAR LA DRET 

HOTEL LUTETIA - PARIS - 18 MAI 1988 


Design of a half-toning integrated circuit based on analog quadratic minimization by non linear 
multistage switched capacitor network 

T. BERNARD, P. GARDA, B. ZAVIDOVIQUE, F. DEVOS 

1988 IEEE INT'L SYMP. ON CIRCUITS & SYSTEMS - HELSINKI - FINLANDE - 7-9 
JUIN 1988 


Image processing VLSI Design through functional match between al gorithms and architectures 
E. ALLART B. ZAVIDOVIQUE - IBIDÈM: 


132 





Conférence sur l'apprentissage 
B. BURG - INVITE CHEZ IBM - AOÛT 1988 


The evolution of information systems 

B. ZAVIDOVIQUE 

INVITE A 1ST INTL INFORMATIC CONGRESS OF RIO DE JANEIRO 
RIO DE JANEIRO - 22-26 AOÛT 1988 


Méthodes de détection de mouvement - Applications à la poursuite 
B. ZAVIDOVIQUE, P. BONNIN, C. MILLOUR 
ECOLE D'AUTOMNE THOMSON - 6-10 SEPTEMBRE 1988 


A family of analog neural half-toning techniques 

T. BERNARD, P. GARDA, A. REICHART, B. ZAVIDOVIQUE, F. DEVOS 
EUSIPCO - 4TH EUROPEAN SIGNAL PROC. CONF. 

GRENOBLE - 5-8 SEPTEMBRE 1988 


Algorithme cellulaire pour une vision monolithique 
À. REICHART, P. GARDA, F. DEVOS, B. ZAVIDOVIQUE 
NEURO-IMAGE 88 - IRASCA - BORDEAUX - 6/8 OCTOBRE 88 


Rétine et B-codage neuronal | 

T. BERNARD, A. REICHART, B. DUGAS, B. ZAVIDOVIQUE, H. RODRIGUEZ, P. 
GARDA, F. DEVOS 

IBIDEM 


Algorithmes de détection de mouvement, application à la poursuite 
B. ZAVIDOVIQUE, P. BONNIN, C. MILLOUR 

INVITES GRECO TRAITEMENT DU SIGNAL ET IMAGERIE 
ENST - PARIS - OCTOBRE 88 


À 60 x 60 Processor Array smart sensor for binary image processin 

P. GARDA, A. REICHART, H. RODRIGUEZ, B. ZAVIDOVIQUE, FE. DEVOS 
1988 IAPR WORKSHOP ON COMPUTER VISION 

TOKYO - JAPON - 12/14 OCTOBRE 1988 


Yet another mesh array smart sensor? 

P. GARDA, A. REICHART, H. RODRIGUEZ, F. DEVOS, B. ZAVIDOVIQUE 
9TH ICPR CONF. ON PATTERN RECOGNITION 

ROME, ITALIE - 17-20 OCTOBRE 1988 


Functional computer for low level image processing 
E. ALLART, B. ZAVIDOVIQUE - IBIDEM 


Analyse de mouvement par imagerie infrarouge utilisant une segmentation coopérative points 
d'intérêt vs région 

P. BONNIN, E. PAUCHON, B. ZAVIDOVIQUE 

 PIXIM 88 - PARIS 24/28 OCT. 1988 


Functional VLSI design for Image Processing IC 
E. ALLART, B. ZAVIDOVIQUE 

22 ND ASTILOMAR CONFERENCE, 

PACIFIC GROVE, CA - 31 OCT/2 NOV 88 


Subsymbolic techniques for perception system control 
X. MERLO, B. ZAVIDOVIQUE - IBIDEM 


A diffusion based edge detector | 
Ë. BELHAIRE, P. GARDA, T. BERNARD, B. ZAVIDOVIQUE - IBIDEM 
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Automatic generation of specific image processing automata from emulation results 
A. SAFIR, B. ZAVIDOVIQUE 

MONTEREY, CA - NOVEMBER 2-4 1988 

VLSI SIGNAL PROCESSING III - P 183-194 IEEE PRESS 


Functional mapping for low level image processing algorithms 

E. ALLART, B. ZAVIDOVIQUE 

MONTEREY, CA - NOVEMBER 2-4 1988 VLSI SIGNAL PROCESSING II P - 173-182 
IÉEE PRESS 


Une rétine électronique automate cellulaire 

P. GARDA, À. REICHART, H. RODRIGUEZ, F. DEVOS, B. ZAVIDOVIQUE 

À PARAITRE DANS LE NUMÉRO SPÉCIAL DE LA REVUE "TRAITEMENT DU SIGNAL 
1989" 


Thèses soutenues: 

Architecture et intégration d'une machine pyramidale pour le traitement et la vision par 
ordinateur Sphinx (recherche terminée à l'IEF) 

P. Amiot 1987 


Vers une méthode d'intégration du concept d'aide à l'utilisateur dans les systèmes logiciels 
complexes 
JM. Frécaut 1988 


Techniques probabilistes d'intégration et de contrôle de la perception en vue de son exploitation 
par le système de décision d'un robot 
X. Merlo 1988 


Aspects algorithmiques d'une vision fruste d'un robot embarquable 
À. Reichart 1988 


Apprentissage de règles de comportement destinées au contrôle d'un système 
B. Burg 1988 


Procédure de B-codage dans les réseaux de processeurs à capteurs intégrés(recherche terminée à 
l'IEF) 


H. Rodriguez 1988 


Architectures fondées sur la connaissance pour l'exécution et le contrôle de processus 
complexes 
J.C. Heudin 1988 


Thèses prévues (1er semestre 89): C. MILLOUR, M. ECCHER, MP. GAYRARD, V. 
SERFATY, P. CLERMONT, A. LANUSSE 
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D3. Rapports techniques internes 
Aide à l'utilisateur: étude d'extension du système d'aide OSIRIS 


Environnement de test en simulation de systèmes de perception 
X-capteurs 


Machines à haut degré de parallélisme pour la vision et la robotique 


Rapport d'étude sur l'intégration du circuit courbe en technologie VLSI 


Expérimentation de mécanismes parallèles en environnement Lisp 
et Occam 


Test d'algorithme de poursuite sur scénarios simulés par synthèse de 


séquences d'images IR 


Ecriture en langage C sur station SUN des modules de gestion des 
données objet, saisie des paramètres d'une séquence. 


Etude et développement d'algorithmes coopératifs et reconnaissance 
des formes pour un système de perception multicapteurs 

Manuel d'utilisation de la manip HECATE 

Détection de mines par imagerie Sonar 

Techniques de reconstruction 3D par stéréovision 


Préétude d'un standard de manipulation et stockage d'Objets de 
Traitement d'Images 


Standard de manipulation et stockage d'Objets de Traitement 
d'Images : Implantation vers VINIX 


Environnement logiciel de traitement d'images: le système LAMPION 
et ses premières extensions 


Module de décision MEDCIN 


Evaluation d'algorithmes de poursuite de cibles: le système de la société 
Intertechnique (Confidentiel industrie) 


Reconnaissance de cibles en formation en imagerie infrarouge 
Commande d'une caméra à 5 degrés de liberté 


Expertise OPSILA/SISP 


Traitement d'images en vue d'aide à la navigation de mobiles aériens 
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JM. Frécaut (Jan.87) 


JL. Desnoyer 
(Fev.87) 


P.Clermont 
A.Lanusse (Août 87) 


C. Legrand (Sept 87) 
E. Perottet (Oct 87) 


P. Bonnin 
(Oct.87) 


J.Y. Cartoux 
(Nov.87) 


A. Lanusse/X. Merlo 
JL. Desnoyer 
(Nov87) 

S. Dacic (Nov.87) 
C. Thomas (Déc.87) 
P. Bonnin (Jan 88) 


E. Devys (Fév.88) 


E. Devys (Juil.88) 


V.Serfaty/L.Bittoun 
(Fév.88) | 


J. Blanc-Talon 
C. Legrand 
P. Bonnin (Juin88) 


C. Thomas 
V. Serfaty (Juillet 88) 


B. Hoeltzener- 
Douarin (88) 


JL.Desnoyer 


_ J.Bissay (Août 88) 


C. Legrand (Sep.88) 


P. Thévenoux 


(Sep.88) 


Rapport d'étude sur l'intégration du circuit "courbe" en technologie T. Iziquel (Oct.88) 

VLSI 

Intégration du circuit courbe en technique VLSI C. Legrand/T. Iziquel 
(Oct.88) 

Interface utilisateur-Modèle d'objet-Modification du système P. Lardjane (Sep.88) 


Rapport d'étude de la décision sur caractéristiques d'images numériques C. Legrand (Déc.88) 
Intégration, contrôle et expérimentation de la machine pyramidale Sphinx T. Bernard (Déc.88) 


Rapports de DEA 


Localisation de sources sonores par antenne acoustique ©. Michel (Juil. 87) 

(PARIS VII CNET) 

Système de communication distribué (ORLEANS) J.M. Gaubert 
(Juil.87) 

Plateforme multicapteur H. Battaglia (Juil.87) 

Etiqueteur de régions connexes (IEF) V. Tortel (Sept.87) 


Méthodes structurelles pour la reconnaissance des formes (PARIS VI) D. Luzeaux (Déc.87) 


Validation d'un modèle de convection solaire par traitement d'image B. Collin (Juil.88) 
(PARIS VII CNET) 

Contrôle à règles et automatique: liens et différence (LSS) V. Gouret (Sept.88) 
Etude de l'intégration d'un détecteur de contour optimal (IEF) E. Belhaire (sept. 88) 
Implantation d'algorithme de fusionnement en T.I. sur une machine JC. Roussel 
massivement parallèle à architecture pyramidale (ORLEANS) (sept.88) 


Rapports de stage 
Robotique et commande processus À. Bourget (Juil.87) 


Évaluation de méthodes syntaxiques de reconnaissance de formes pour Sanchez Beltram (87) 
l'apprentissage automatique | | 


Conception et réalisation d'un système multicapteurs O. Dessoude 
Y.Vimont 
H. Tonchia (Juil.87) 
Sérialisation de données informatiques | S. Larousse 
(Août 88) 
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